BI
107-Debe soportar la lógica de negocio y análisis estadísticos que sean necesarios para los usuarios
ANALYSIS (Análisis)
132-Cliente, cliente ligero, o sólo con el navegador. En este tipo de acceso el navegador comunica con un servidor web, el cual habla con la aplicación del servidor, que es la que conecta con el Data Warehouse
Acceso Web
74-Borrar los datos y volver a cargarlos
Actualización completa
75-Borrado sólo parte de los datos, por ejemplo desde una fecha, y carga de los nuevos datos. Comparar los datos de origen y de destino, actualizando sólo los cambios. Uso de triggers u otras técnicas de replicación. Captura de datos mediante una aplicación diseñada específicamente para ello. Existencia de columnas timestamp que permitan seleccionar las filas modificadas desde la última extracción y aplicar dichos cambios en destino
Actualización incremental
68-Proceso por el cual se resumen los datos a partir de las filas de detalle de máxima granularidad
Agregación
69-Hoy en día disponemos de sistemas OLAP que se encargan de agregar dichos datos y ofrecerlos al usuario con una gran rapidez y eficacia
Agregación
1-Establece el marco de trabajo, estándares y procedimientos para el DW a un nivel empresarial
Arquitectura de un Data Warehouse
28-Serán cada una de las características que necesitemos almacenar
Atributos de la dimensión
29-Lo habitual es que haya varias decenas de ellos, incluso que en algunos casos superen el centenar
Atributos de la dimensión
43-Esquema, habitualmente en forma de tabla, que representa los diversos DataMarts y las diferentes dimensiones definidas en nuestra organización
Bus Dimensional
79-Proceso de incorporar los datos al Data Warehouse y/o a los diferentes Data Marts, y a los cubos OLAP
Carga en el Data Warehouse
80-Todo ello según la presentación, formatos definidos y periodicidad de actualización propuesta
Carga en el Data Warehouse
27-Es la clave con la que trabaja habitualmente el usuario, pero no puede ser la clave principal porque se pueden producir duplicidades
Clave de negocio
33-Identifica de forma única cada fila.
Clave principal
32-Son elementos de una tabla de hechos
Clave principal, Claves externas, Medidas, Metadatos y linaje
24-Es la clave principal de la tabla de dimensiones
Clave subrogada
25-Nos permite identificar de forma única cada fila, suele ser un entero auto incremental
Clave subrogada
26-Es totalmente transparente al usuario de negocio, no la usará en ningún momento, ni tan siquiera tendrá conocimiento de su existencia
Clave subrogada
23-Son elementos de una tabla de dimensiones
Clave subrogada, Clave de negocio, Atributos de la dimensión, Fecha de Inicio y Fecha de Fin
35-Apuntan hacia las claves principales (claves subrogadas) de cada una de las dimensiones que tienen relación con dicha tabla de hechos
Claves externas (Foreign Keys)
131-Lo que significa tener las instalaciones locales en los ordenadores de los usuarios
Cliente/Servidor
130-Son formas de acceso de las herramientas OLAP
Cliente/Servidor, Acceso Web y Virtual o Desktop OLAP (DOLAP)
138-Documento en el que se reflejan las principales métricas de una empresa, con ellos se puede hacer un seguimiento a los factores que contribuyen a su funcionamiento y su éxito. Estos ayudan a diagnosticar si se están haciendo bien o no las cosas
Dashboard & Scorecard
143-Es el proceso para descubrir e interpretar patrones desconocidos en la información mediante los cuales resolver problemas de negocio
Datamining o Minería de Datos
55-El desafío de integrar datos de sistemas operacionales a través de las aplicaciones y los límites del sistema es una necesidad primordial
Desnormalización del DW
56-En muchos casos, el cometido es solamente poblar el Data Warehouse
Desnormalización del DW
57-Sólo después de que esté en uso, muchos de los casos de inconsistencia , duplicación y desnormalización de datos salen a la superficie
Desnormalización del DW
58-Además de la revisión de los datos de arriba a abajo, es necesaria una investigación de abajo hacia arriba de los datos reales que están en el Data Warehouse para asegurar su operación exitosa
Desnormalización del DW
126-Si queremos cambiar las dimensiones, debemos cargar de nuevo el cubo
Desventaja de Molap
49-Generación de estructuras dimensionales innecesarias para la correcta toma de decisiones, se desperdician recursos valiosos y alargan los tiempos de implementación
Desventaja de la Estrategia Bottom-up
50-Para una correcta toma de decisiones, no solo se requiere la información presente en los sistemas transaccionales, también es necesaria información externa a la empresa, información que queda fuera del modelo al ser utilizado este enfoque
Desventaja de la Estrategia Bottom-up
54-Aumenta la complejidad en la obtención de información necesaria para la carga de datos, especialmente cuando las fuentes no se encuentran automatizadas o están fuera de la organización
Desventaja de la Estrategia Top-down
115-Selecciona dos o más dimensiones de un cubo dado y proporciona un nuevo sub-cubo
Dice
19-Son las perspectivas de análisis de las variables, son catálogos de información necesarios para la presentación de los datos a los usuarios
Dimensiones
118-Bajamos a más detalle (en inglés "drill-down") en atributos de una dimensión sobre los que se ha definido una jerarquía
Drill-down
72-Procesos que leen los datos de las diferentes fuentes, los transforman y adaptan al modelo que hayamos definido, los depuran y limpian, y los introducen en la base de datos destino
ETL (Extract, Transform and Load)
73-Se deben reconciliar todos los datos de las diferentes fuentes, realizar los cálculos necesarios, mejorar la calidad de los datos, adaptarlos al nuevo modelo físico y almacenarlos en él
ETL (Extract, Transform and Load)
3-Son resultados del desarrollo de la arquitectura DW
El modelo de datos fuente, El modelo de datos conceptual DW, Arquitectura tecnológica DW, Estándares y procedimientos DW, El plan de implementación incremental para el DW
41-Algunas de las dimensiones no están relacionadas directamente con la tabla de hechos, sino que se relacionan con ella a través de otras dimensiones
Esquema en copo de nieve (snowflake schema)
42-En este caso también tenemos una tabla de hechos, situada en el centro, que contiene todas las medidas y una o varias tablas adicionales, con un mayor nivel de normalización
Esquema en copo de nieve (snowflake schema)
40-Hay una única tabla central, la tabla de hechos, que contiene todas las medidas y una tabla adicional por cada una de las perspectivas desde las que queremos analizar dicha información, es decir por cada una de las dimensiones
Esquema en estrella (Star Schema)
45-Construcción de un Data Warehouse desde la información contenida en los sistemas transaccionales
Estrategia Bottom-up
46-Genera todas las estructuras dimensionales desde las fuentes de datos de los sistemas OLTP
Estrategia Bottom-up
44-Son estrategias de Generación del Data Warehouse
Estrategia Bottom-up y Estrategia Top-down
51-Establece como paso inicial la definición de todos los requerimientos de información para los ejecutivos de la organización
Estrategia Top-down
52-Se identifican las fuentes de información que serán utilizadas para satisfacer los requerimiento definidos, dichas fuentes pueden ser sistemas transaccionales, información no automatizada y fuentes externas a la organización
Estrategia Top-down
6-Son una parte importante de la arquitectura del DW
Estándares
70-Proceso que permite a las organizaciones extraer, transformar y cargar los datos a otra fuente de información
Extract-Transform-Load (ETL)
71-Sirve principalmente para mantener una consistencia en los datos y eliminar o corregir los que estén erróneos
Extract-Transform-Load (ETL)
106-Debe ser rápido, necesitamos lanzar consultas y ver los resultados inmediatamente
FAST (Rápido)
30-Servirán para conocer el periodo de vigencia de cada una de las versiones de los atributos
Fecha de Inicio y Fecha de Fin
87-Son componentes de la arquitectura de BI
Fuentes de información, ETL, Data Warehouse
85-Que tenga registradas las operaciones de inserción, actualización y borrado que se han ido produciendo en el origen, y aplicar esos cambios en el destino; Este proceso es más eficiente y consume menos recursos en origen y destino, que hacer una lectura de dicho origen, compararlo con el destino, y obtener de ahí las diferencias para seguidamente aplicarlas al destino
Generación de tablas Delta
134-Utilizadas por desarrolladores profesionales para crear informes estándar para grupos, departamentos o la organización
Generadores de informes
90-Proveer un repositorio donde definir, documentar y gestionar la información del proceso ETL y su ejecución. El Metadata debería ser accesible también desde otras aplicaciones
Gestión del Metadata
17-Nivel de detalle que se tomará para analizar la información
Granularidad
18-Depende de los requerimientos del negocio y de los datos con los que se cuentan
Granularidad
65-Es importante a la hora de diseñar una tabla de hechos, tener en cuenta el nivel de granularidad que va a tener, es decir, el nivel de detalle más atómico que vamos a encontrar de los datos
Granularidad
66-No es lo mismo tener una fila por cada venta, que una fila donde se indiquen las ventas del día para cada artículo y tienda
Granularidad
127-Accede a los datos de alto nivel en una base de datos multidimensional
HOLAP: Hybrid OLAP
128-Accede a los datos atómicos directamente sobre la base de datos relacional
HOLAP: Hybrid OLAP
129-En esencia utiliza las ventajas del ROLAP y del MOLAP
HOLAP: Hybrid OLAP
112-Los contenidos de cada uno de los cubos individuales recogen lo que llamamos
Hechos
104-Los usuarios necesitan analizar información a distintos niveles de agregación y sobre múltiples dimensiones; Los usuarios pueden hacer este análisis al máximo nivel de agregación o al máximo nivel de detalle; A estos tipos de análisis les llamamos multidimensionales, porque nos facilitan el análisis de un hecho desde distintas perspectivas o dimensiones; La visualización de la información es independiente respecto de cómo se haya almacenado
Herramientas OLAP
136-Permiten a los usuarios finales tratar la información de forma multidimensional para explorarla desde distintas perspectivas y periodos de tiempo
Herramientas OLAP
142-Permiten a estadísticos o analistas de negocio crear modelos estadísticos de las actividades de los negocios
Herramientas datamining
137-Permiten a los usuarios finales ver información crítica para el rendimiento con un simple vistazo utilizando íconos gráficos y ver más detalle para analizar información
Herramientas de Dashboard & Scorecard
145-Estas herramientas añaden una capa de visualización sobre la que representan los valores que obtenemos de las herramientas de BI
Herramientas de Georeferencia
146-La información es representada sobre un área geográfica
Herramientas de Georeferencia
139-Permite a los analistas y a los usuarios finales crear planes de negocio y simulaciones con la información de BI
Herramientas de planificación, modelización y consolidación
140-Pueden ser para elaborar la planificación, los presupuestos, las previsiones
Herramientas de planificación, modelización y consolidación
141-Estas herramientas proveen a los dashboards y los scorecards con los objetivos y los umbrales de las métricas
Herramientas de planificación, modelización y consolidación
135-Empleadas por usuarios finales para crear informes para ellos mismos o para otros; no requieren programación
Herramientas de usuario final de consultas e informes
110-Debe poder manejar toda la información relevante y la información derivada
INFORMATION (Información):
101-Nos permite agregar o desagregar la información
Jerarquías
102-Nos permiten hacer agrupaciones
Jerarquías
103-Cambiar el orden de las distintas dimensiones en función de las necesidades de consulta
Jerarquías
59-Esto resulta en formatos múltiples de datos dentro de distintas bases, haciendo cualquier intento de consolidación imposible
La falta de estándares de datos
62-A menudo, los números de cuenta múltiples bloquean una vista consolidada. Esto puede ser el caso cuando un grupo familiar tiene a varios miembros, cada uno con su propio número de cuenta, o cuando una casa matriz tiene sucursales múltiples. Tales casos requieren capacidades investigativas fuertes para localizar y organizar la información relacionada
La miopía de datos
63-Considere las numerosas opciones disponibles para los empleados que cargan datos para ingresar un nombre de compañía, dirección, número de teléfono dentro de un campo de datos Súmese al número de abreviaciones convencionales un número igual o mayor de abreviaciones convenientes Multiplique estos por el número de campos, el número de empleados que ingresan datos, y el número de entradas reales, y usted comienza a entender la pesadilla de igualar y consolidar información compleja
La pesadilla de las anomalías
64-Esto ocurre cuando los valores de datos se desvían de los metadatos y de las reglas del negocio Por ejemplo, los nombres comerciales a menudo quedan mezclados con nombres personales; y la información de relaciones como "dba" o "c/o" se puede encontrar en una gran variedad de campos Pero simplemente porque los datos no están donde deberían, no quiere decir que son datos que usted puede ignorar
Las sorpresas de datos
86-Es importante llevar a cabo una serie de tareas de limpieza de datos y detección de incoherencias; Podemos hacer ciertas correcciones sobre datos que tenemos la certeza de que no son correctos, o simplemente no entrarlos al destino y dejarlos en algún lugar para que alguien los revise
Limpieza de datos
111-Son la representación gráfica del OLAP
Los cubos OLAP
60-Esto a menudo ocurre cuando la información no solicitada es entrada en campos de texto independiente
Los datos ocultos
61-Por la rigidez de la mayoría de los metadatos, la información "adicional" crítica es a menudo dejada de lado y necesita ser descubierta antes de ser manipulada
Los datos ocultos
124-Accede directamente sobre una base de datos multidimensional (MDDB)
MOLAP: Multidimensional OLAP
109-Tiene que proveer una visión conceptual de la información a través de distintas dimensiones
MULTIDIMENSIONAL (Multidimensional)
36-Representan columnas que contienen datos cuantificables, numéricos, que se pueden agregar. Por ejemplo, cantidad, importe, precio, margen, número de operaciones, etc.
Medidas (Measures)
88-Nos explicita todos los atributos de las tablas, de los sistemas de donde provienen, así como la definición de cada uno de los atributos de las mismas
Metadata
89-Puede incorporar también si los campos son recalculados o transformados y el detalle de las transformaciones que se han llevado a cabo
Metadata
91-Es el repositorio central de información de la información
Metadata
92-Nos da el significado de cada uno de los componentes y sus atributos que residen en el Data Warehouse (o Data Mart)
Metadata
93-Puede incluir definiciones de negocio, descripciones detalladas de los tipos de datos, formatos y otras características
Metadata
98-Este es un punto complejo de todo proyecto, ya que obliga a que se definan los conceptos de negocio y se homogenicen entre los distintos departamentos, filiales, etc.
Metadata
99-Obliga a que todos los componentes de la organización hablen utilizando la misma terminología y con el mismo significado
Metadata
37-Nos permite obtener información adicional sobre la fila, como por ejemplo, qué día se incorporó al Data Warehouse, de qué origen proviene (si tenemos varias fuentes), etc. No es necesario para el usuario de negocio, pero es interesante analizar en cada tabla de hechos que nos aporta y si merece la pena introducir algunas columnas de este tipo
Metadatos y linaje
10-Se basa en lo que Kimball denomina Ciclo de Vida Dimensional del Negocio
Metodología de Ralph Kimball
11-Propone un enfoque de menor a mayor en la construcción del DW
Metodología de Ralph Kimball
9-Serie de pasos para crear un Data Warehouse
Metodología de Ralph Kimball
13-Técnica para modelar bases de datos simples y entendibles al usuario final
Modelo Dimensional
14-La idea fundamental del es que el usuario visualice fácilmente la relación que existe entre los distintos componentes del modelo
Modelo Dimensional
4-Proveen una estructura para identificar, nombrar, describir y asociar los componentes de una base de datos
Modelos de datos
20-En este paso se tienen que identificar las medidas que surgen en el proceso de negocio
Métricas
21-Viene siendo qué es lo que se va a analizar
Métricas
22-Se colocan en una tabla llamada tabla de hechos
Métricas
83-Para conseguir una máxima escalabilidad y para afectar lo mínimo posible al rendimiento de los servidores transaccionales que van a ser nuestros orígenes de datos, debemos consumir de ellos los mínimos recursos posibles, y centrar el consumo de dichos recursos en el servidor que se encarga de realizar los procesos ETL
Mínimo impacto sobre el origen
82-Son recomendaciones para la carga de un área de staging
Mínimo impacto sobre el origen, Trazabilidad del dato, Generación de tablas Delta, Limpieza de datos
2-Integrar al DW las necesidades de información empresarial
Objetivos de las actividades de la arquitectura
116-Rota el cubo, proporcionando una vista alternativa de los datos
Pivot o Pivoting
8-Es la parte de la arquitectura de DW que identifica los incrementos del DW y describe la secuencia de desarrollo de estos incrementos
Plan de implementación
16-Define el proceso de negocio que se estará analizando
Proceso de Negocio
15-Son los pasos del ciclo de vida dimensional del negocio
Proceso de Negocio, Granularidad, Dimensiones, Métricas
119-Acceden directamente a la base de datos relacional (RDBMS).
ROLAP: Relational OLAP
120-Accede habitualmente sobre un modelo "estrella"
ROLAP: Relational OLAP
121-No tiene limitaciones en cuanto al tamaño
ROLAP: Relational OLAP
122-Es más lento que el MOLAP
ROLAP: Relational OLAP
123-Algunos productos comerciales permiten cargar cubos virtuales para acelerar los tiempos de acceso
ROLAP: Relational OLAP
117-Ver el máximo nivel de agregación (en inglés "roll-up") en atributos de una dimensión sobre los que se ha definido una jerarquía
Roll-up
38-La nueva información sobrescribe a la antigua, no se guardan históricos y sólo se tiene la versión actual. Dicha sobre escritura se produce cuando se detecta algún error en los valores para corregirlo y mejorar la calidad del dato
SCD tipo 1, sobre escritura
39-Refleja toda la información histórica. Por cada cambio que se produzca, se crea una nueva fila en la tabla de dimensiones con la fecha de inicio y una nueva clave subrogada, y se marca la fecha de fin de la versión anterior. Cada hecho que entra, debe comprobar a qué versión de la fila en la tabla de dimensiones se debe asociar en función de la fecha en la que se produzca
SCD tipo 2, historial de cambios
108-Debe apoyar el intercambio y la accesibilidad. Debe mantener la integridad de la información al proporcionar confidencialidad (seguridad) y administrar el acceso concurrente
SHARED (Compartido)
114-Selecciona una dimensión en particular de un cubo dado y proporciona un nuevo sub-cubo
Slice
31-Son tablas que representan un proceso de negocio, por ejemplo, las ventas, las compras, los pagos, los apuntes contables, los clics sobre nuestro sitio web, etc.
Tablas de Hechos
76-Asegurar que los datos sean válidos, de su integridad y de su utilidad, lo que suele incluir realizar cálculos y generar nuevos valores
Transformación de los datos
77-Los datos deben ser depurados para eliminar inconsistencias, discrepancias y duplicidades
Transformación de los datos
78-Estas transformaciones suelen conllevar cambios con respecto a la estructura de origen para adaptarla al destino, cambios en el contenido de los valores de origen y creación de nuevos valores en las filas de destino
Transformación de los datos
84-Es muy importante saber dónde, cuándo y quién ha realizado cada cambio; Realizar los procesos de extracción y de obtención de diferencias entre el origen y el destino; Ir almacenando todos los cambios que nos encontremos para poder seguir la pista de cualquier dato y de los cambios que ha sufrido
Trazabilidad del dato
125-Es muy rápida en los tiempos de respuesta
Ventaja de Molap
47-Se asegura la existencia de toda la información de los sistemas OLTP, que requiera el Data Warehouse
Ventaja de la Estrategia Bottom-up
48-Posibilita la generación de mecanismos de carga automatizados que simplifiquen las operaciones de mantenimiento y administración de la información
Ventaja de la Estrategia Bottom-up
53-El Data Warehouse resultante está realmente enfocado a las necesidades de los clientes y que apoya de forma más eficiente la toma de decisiones
Ventaja de la Estrategia Top-down
100-La existencia de las jerarquías en las dimensiones nos permite pasar del máximo detalle a la agregación en los distintos niveles
Verdadero
105-Los productos OLAP deben cumplir con el concepto FASMI
Verdadero
113-OLAP permite que cada uno de los cubos individuales pueda contener más de un hecho
Verdadero
12-La metodología de Ralph Kimball incluye la planificación, análisis de requerimientos y diseño
Verdadero
34-Al igual que en los sistemas transaccionales toda tabla debe tener una clave principal, en una tabla de hechos puede tenerla o no, y esto tiene sus pros y sus contras, pero ambas posturas son defendibles
Verdadero
5-Se necesitan modelos de datos tanto para los datos fuente como para los datos seleccionados que van a incorporarse en el DW
Verdadero
67-A mayor granularidad, mayor será el número de filas de nuestra tabla de hechos, y dado que el espacio en disco y rendimiento no se ven notablemente afectados en los sistemas actuales, debemos llegar siempre al máximo nivel de granularidad que resulte útil a los usuarios
Verdadero
7-Sin estándares, no son posibles las oportunidades para reusar y hay riesgos de que partes del desarrollo no obtengan los beneficios de la integración
Verdadero
94-La información que contiene el Metadata es útil para los departamentos de tecnología y los propios usuarios
Verdadero
97-La construcción del Metadata supone que se defina el significado de cada una de las tablas y cada uno de los atributos que se cargan en el Data Warehouse
Verdadero
95-El personal de los departamentos de Tecnología necesita saber los orígenes de la información: bases de datos de las que obtenemos los datos, qué transformaciones realizamos, criterios de filtros de información, nombre de las columnas y de las tablas, plazos de carga, utilización, etc
Verdadero (Debe conocer la Metadata)
96-Los usuarios necesitan saber las entidades y sus atributos, cómo han sido calculados, quiénes son los responsables de los datos, los informes disponibles, los flujos de distribución de la información, etc.
Verdadero (Debe también conocer cierta Metadata)
133-En este caso creamos un cubo con las dimensiones que le interesan al usuario. La ventaja es que el usuario sólo recibe los hechos y las dimensiones en los que está interesado y los analiza en forma local
Virtual o Desktop OLAP (DOLAP)
144-Son usos más habituales del datamining
segmentación, venta cruzada, hábito de consumo, clasificación, previsiones, optimizaciones, etc.
81-Es un área temporal que se encuentra en el flujo de datos entre las fuentes y el Data Mart o Data Warehouse con el fin de: Facilitar la extracción de datos, Realizar tareas de limpieza (data cleansing), Mejorar la calidad de los datos, Ser utilizada como caché de los datos operacionales o acceder a un nivel de detalle de los datos y de los cambios no almacenados en el DataMart o Data Warehouse
Área de staging