Inteligencia de Negocio 2do Parcial
Asociacion
Busca elementos de los datos que con frecuencia aparecen conjuntamente en las mismas transacciones
Arboles de regresion
Es cuando el resultado predicho se puede considerar un número real
Consultas empaquetadas
Se ejecutan periódicamente, sin necesidad de intervención del usuario
Discretizacion
Se realiza cuando el error en la medida puede ser grande o existen ciertos umbrales significativos
Analisis de Asociaciones
Se utilizan para descubrir hechos que ocurren en común dentro de un determinado conjunto de datos
Dimensiones
Son aquellos datos que nos permiten filtrar, agrupar o seccionar la información
Arboles de decisiones
Son clasificadores que en función de un conjunto de atributos permiten determinar a qué clase pertenece el caso objeto de estudio
Arboles de decisiones
Son comúnmente usados en la minería de datos para examinar los datos e inducir las reglas para realizar predicciones
Modelos predictivos
Son modelos de la relación entre el rendimiento específico de un sujeto en una muestra y uno o más atributos o características del mismo sujeto
Metodos Estadisticos
Son procedimientos para manejar datos cuantitativos y cualitativos mediante técnicas de recolección, recuento, presentación, descripción y análisis
Metodos simbolicos
Su característica más importante es que son auto explicativos , a simple vista se puede observar la consideración de la clasificación de la data
HOLAP
Almacena algunos datos en un motor relacional y otros en una base de datos multidimensional.
ROLAP
Almacena los datos en un motor relacional
MOLAP
Almacena los datos en una base de datos multidimensional.
Verificacion de hipotesis
Es la actividad que mediante la observación, la experimentación, el análisis estadístico o la encuesta, se comprueba adecuadamente, si una hipótesis es falsa o verdadera
Funciones de base radial
Es un metodo de Inducción supervisada
Prediccion neuronal
Es un metodo de Inducción supervisada
Arquitectura OLAP
Es una herramienta de verificacion
Analisis de regresion
Es una herramienta estadísticas que determina la relación entre 2 o más variables cuantitativas
OLAP
Es una herramientas de análisis multidimensional
Funciones de Base Radial
Funciona especialmente bien cuando la estructura de los datos tiende a agruparse en conjuntos , ya que implementa cierto tipo de segmentación
Arbol de clasificación y regresion
Genera un árbol de decisión que permite predecir o clasificar observaciones futuras
CHAID
Genera árboles de decisión utilizando estadísticos de chi-cuadrado para identificar las divisiones óptimas
Hechos
Las tablas de hechos contienen los datos correspondientes a un proceso de negocio particular
Slice and dice
Mover el cubo como si fuera un dado para obtener una cara del cubo
SIATD
Permite no solo construir, validar y refinar modelos aplicándolos a datos extraídos a partir de la base de datos propia del sistema, de la base de datos corporativa de la organización o de otros suministradores externos de datos
Prediccion Neuronal
Permite predecir datos en forma de series temporales
Seleccion de datos
Permite reducir los recursos computacionales requeridos en el proceso de minería de datos
Drill down and roll up
Abrir los datos de las dimensiones a fin de obtener más detalle
Prediccion Neuronal
Basada en redes neuronales
Segmentacion
Conjunto de procesos cuya finalidad es crear una estructura de base de datos orientada a la gestión de la comunicación con los clientes
Analisis de afinidad
Conocido como "Link Analysis" se refiere a encontrar relaciones no evidentes en los datos
Asociacion
Conocido como "Link Analysis" se refiere a encontrar relaciones no evidentes en los datos
OLAP
Consiste en consultas a estructuras multidimensionales permitiendo al usuario tener una visión más rápida e interactiva de los datos
Analisis de cluster
Consiste en organizar la información en grupos de datos que sean heterogéneos a los que se los conoce como cluster de datos
Herramientas de consulta e informes
Constituyen el enlace entre los datos y los usuarios, a través de una interfaz gráfica
Consulta Ad Hoc
Consultas frecuentes y aleatorias, en el sentido en que responden a necesidades de información
Prediccion Neuronal
Crea un modelo que s e utiliza para predecir nuevos valores y pronóstico de series temporales
Prediccion Neuronal
Detecta de forma automática la topología más adecuada para cada problema, aunque permite especificar una concreta
Funciones de Base Radial
Detecta el número de centroides óptimo, redefiniendo el número máximo de éstos y el número mínimo de registros asignados a cada centro
Analisis de asociaciones
Detecta elementos en una transacción que implica la presencia de otros elementos
Analisis de Asociaciones
El objetivo de este análisis es establecer relación entre los registros de un a base de datos
Patrones secuenciales
El objetivo de la tarea es poder describir de forma concisa relaciones temporales que existen entre los valores de los atributos del conjunto de ejemplos
Clustering
El objetivo es particionar o segmentar un conjunto de datos o individuos en grupos que pueden ser disjuntos o no
Transformacion de datos
En esta etapa se transforma o consolidan los datos en formas apropiadas para ser minadas, a través de resúmenes u operaciones de agregación
Normas de secuencia
Encuentra secuencias típicas de sucesos en los datos, una secuencia es un conjunto ordenado de conjuntos de elementos
Arboles de clasificacion
Es cuando el resultado predicho es la clase a la que pertenecen los datos
Mineria de Datos
Es el conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto
Clasificacion neuronal
Es el problema de identificar a cual de un conjunto de categorías (subpoblaciones) una nueva observación pertenece, sobre la base de un conjunto de formación de datos que contienen observaciones (o instancias) cuya categoría de pertenencia es conocida
Numeracion
Es menos común que la discretización, es utilizado comúnmente cuando el método de minería de datos que vamos a utilizar no admite datos nominal
Clustering
Es similar a la clasificación, excepto que los grupos no son predefinidos
Clustering
Es un procedimiento de agrupación de una serie de vectores de acuerdo con un criterio
Arboles de clasificacion
Es un tipo de arbol de decisiones
Arboles de regresion
Es un tipo de arbol de decisiones
Consulta Ad Hoc
Es un tipo de consultas
Consultas empaquetadas
Es un tipo de consultas
Dashboards
Es un tipo de herramientas de consulta e informes
Data Mining
Es un tipo de herramientas de consulta e informes
EIS
Es un tipo de herramientas de consulta e informes
OLAP
Es un tipo de herramientas de consulta e informes
Reportes y Consultas
Es un tipo de herramientas de consulta e informes
Analisis de errores o deteccion de fraudes
Es una area de aplicacion de la minería de datos
Gestion del nivel de stock en el almacen
Es una area de aplicacion de la minería de datos
Prevencion de errores con patrones secuenciales
Es una area de aplicacion de la minería de datos
Promociones de venta
Es una area de aplicacion de la minería de datos
Accesibilidad a la información
Es una características de herramientas de consulta e informes
Apoyo en la toma de decisiones
Es una características de herramientas de consulta e informes
Orientación a los usuarios finales
Es una características de herramientas de consulta e informes
Dimensiones y Hechos
Es una herramienta de verificacion
Herramientas de analisis multidimensional
Es una herramienta de verificacion
Herramientas de consulta e informes
Es una herramienta de verificacion
Navegación sobre los datos
Es una herramienta de verificacion
Descubrimiento de secuencias
Es usado para descubrir secuencias de patrones en los datos, estos patrones son similares a los encontrados con reglas de asociación pero tales relaciones son basadas en el tiempo
Analisis de correlaciones
Es útil para entender las correlaciones entre un grupo de variables
Funciones de mineria de datos
Estas funciones de minería de datos proporcionan soluciones de a diversos problemas de negocios
Analisis de asociaciones
Expresa las afinidades entre elementos en forma de asociación "XFB"
C5.0
Genera un árbol de decisión o un conjunto de reglas. El modelo divide la muestra basándose en el campo que ofrece la máxima ganancia de información en cada nivel
SIATD
Incluye las herramientas necesarias para representar estos datos o los resultados de las aplicaciones de los modelos, según diferentes gráficas
Clasificacion
Mapea o asocia datos a grupos predefinidos. También llamado aprendizaje supervisado
Discriminacion
Mapea o asocia datos a grupos predefinidos. También llamado aprendizaje supervisado
Segmentacion
Mediante dichos procesos se determina el valor que tiene cada cliente para la empresa, permitiendo destinar los recursos a aquéllos que garantizan un mayor retorno de la inversión
Perceptron
Neurona artificial o unidad básica de inferencia en forma de discriminador lineal, a partir de lo cual se desarrolla un algoritmo capaz de generar un criterio para seleccionar un sub-grupo a partir de un grupo de componentes más grande
DOLAP
Orientado a equipos de escritorio (Desktop OLAP).
Sumarizacion de datos
Permite tener una visión general de la estructura de los datos. generalmente este es utilizado en las primeras instancias de un proyecto
Metodos Estadisticos
Permiten comprobar hipótesis o establecer relaciones de causalidad en un determinado fenómeno
Minería de Datos
Proceso de extraer información comprensible, válida, y previamente desconocida, a partir de grandes volúmenes de datos, y dedicarla al soporte de la toma de decisiones de negocio
Clasificacion
Puede crear, validar o probar modelos de clasificación
Funciones de Base Radial
Pueden procesar variables cuantitativas y cualitativas a la vez
Minería de Datos
Se define como el proceso de descubrir información oculta valiosa mediante el análisis de grandes cantidades de datos
Analisis de Asociaciones
Se puede utilizar como base para tomar decisiones sobre marketing como precios promocionales para ciertos productos o dónde ubicar éstos dentro del supermercado
Funciones de Base Radial
Se puede utilizar el método de función de base radial (FBR) para ajustar datos que son función de diversas variables
Patrones secuenciales
Se trata de buscar asociaciones de la forma: si sucede el evento X en el instante de tiempo t entonces sucederá el evento Y en el instante t+n"
Deteccion de desviaciones
Se trata de identificar casos anómalos a partir de la experiencia anterior
Regresión
Se usa una regresión para predecir los valores ausentes de una variable basándose en su relación con otras variables del conjunto de datos
Seleccion de datos
Su importancia se encuentra en que eliminar los datos, que aportan poco o que afectan negativamente el modelo
Deteccion de Desviaciones
Su objetivo es identificar puntos espurios en un conjunto de datos determinado, y explicar a qué se debe la presencia de los datos
Mineria de Datos
Surge para intentar ayudar a comprender el contenido de un repositorio de datos
Induccion supervisadas
También conocidos como métodos predictivos. Estos predicen un dato (o un conjunto de ellos ) desconocido, a partir de la entrada de un conjunto de valores obtenidos a lo largo de un tiempo determinado de los que se extrae un comportamiento futuro
Descubrimiento de las asociaciones
Trata sobre la exploración de datos con el fin de identificar relaciones entre valores dentro de una base de datos
Herramientas de verificacion de hipotesis
permiten consultar información de interés la misma que se encuentra estructurada en un Data Warehouse