BI

Pataasin ang iyong marka sa homework at exams ngayon gamit ang Quizwiz!

107-Debe soportar la lógica de negocio y análisis estadísticos que sean necesarios para los usuarios

ANALYSIS (Análisis)

132-Cliente, cliente ligero, o sólo con el navegador. En este tipo de acceso el navegador comunica con un servidor web, el cual habla con la aplicación del servidor, que es la que conecta con el Data Warehouse

Acceso Web

74-Borrar los datos y volver a cargarlos

Actualización completa

75-Borrado sólo parte de los datos, por ejemplo desde una fecha, y carga de los nuevos datos. Comparar los datos de origen y de destino, actualizando sólo los cambios. Uso de triggers u otras técnicas de replicación. Captura de datos mediante una aplicación diseñada específicamente para ello. Existencia de columnas timestamp que permitan seleccionar las filas modificadas desde la última extracción y aplicar dichos cambios en destino

Actualización incremental

68-Proceso por el cual se resumen los datos a partir de las filas de detalle de máxima granularidad

Agregación

69-Hoy en día disponemos de sistemas OLAP que se encargan de agregar dichos datos y ofrecerlos al usuario con una gran rapidez y eficacia

Agregación

1-Establece el marco de trabajo, estándares y procedimientos para el DW a un nivel empresarial

Arquitectura de un Data Warehouse

28-Serán cada una de las características que necesitemos almacenar

Atributos de la dimensión

29-Lo habitual es que haya varias decenas de ellos, incluso que en algunos casos superen el centenar

Atributos de la dimensión

43-Esquema, habitualmente en forma de tabla, que representa los diversos DataMarts y las diferentes dimensiones definidas en nuestra organización

Bus Dimensional

79-Proceso de incorporar los datos al Data Warehouse y/o a los diferentes Data Marts, y a los cubos OLAP

Carga en el Data Warehouse

80-Todo ello según la presentación, formatos definidos y periodicidad de actualización propuesta

Carga en el Data Warehouse

27-Es la clave con la que trabaja habitualmente el usuario, pero no puede ser la clave principal porque se pueden producir duplicidades

Clave de negocio

33-Identifica de forma única cada fila.

Clave principal

32-Son elementos de una tabla de hechos

Clave principal, Claves externas, Medidas, Metadatos y linaje

24-Es la clave principal de la tabla de dimensiones

Clave subrogada

25-Nos permite identificar de forma única cada fila, suele ser un entero auto incremental

Clave subrogada

26-Es totalmente transparente al usuario de negocio, no la usará en ningún momento, ni tan siquiera tendrá conocimiento de su existencia

Clave subrogada

23-Son elementos de una tabla de dimensiones

Clave subrogada, Clave de negocio, Atributos de la dimensión, Fecha de Inicio y Fecha de Fin

35-Apuntan hacia las claves principales (claves subrogadas) de cada una de las dimensiones que tienen relación con dicha tabla de hechos

Claves externas (Foreign Keys)

131-Lo que significa tener las instalaciones locales en los ordenadores de los usuarios

Cliente/Servidor

130-Son formas de acceso de las herramientas OLAP

Cliente/Servidor, Acceso Web y Virtual o Desktop OLAP (DOLAP)

138-Documento en el que se reflejan las principales métricas de una empresa, con ellos se puede hacer un seguimiento a los factores que contribuyen a su funcionamiento y su éxito. Estos ayudan a diagnosticar si se están haciendo bien o no las cosas

Dashboard & Scorecard

143-Es el proceso para descubrir e interpretar patrones desconocidos en la información mediante los cuales resolver problemas de negocio

Datamining o Minería de Datos

55-El desafío de integrar datos de sistemas operacionales a través de las aplicaciones y los límites del sistema es una necesidad primordial

Desnormalización del DW

56-En muchos casos, el cometido es solamente poblar el Data Warehouse

Desnormalización del DW

57-Sólo después de que esté en uso, muchos de los casos de inconsistencia , duplicación y desnormalización de datos salen a la superficie

Desnormalización del DW

58-Además de la revisión de los datos de arriba a abajo, es necesaria una investigación de abajo hacia arriba de los datos reales que están en el Data Warehouse para asegurar su operación exitosa

Desnormalización del DW

126-Si queremos cambiar las dimensiones, debemos cargar de nuevo el cubo

Desventaja de Molap

49-Generación de estructuras dimensionales innecesarias para la correcta toma de decisiones, se desperdician recursos valiosos y alargan los tiempos de implementación

Desventaja de la Estrategia Bottom-up

50-Para una correcta toma de decisiones, no solo se requiere la información presente en los sistemas transaccionales, también es necesaria información externa a la empresa, información que queda fuera del modelo al ser utilizado este enfoque

Desventaja de la Estrategia Bottom-up

54-Aumenta la complejidad en la obtención de información necesaria para la carga de datos, especialmente cuando las fuentes no se encuentran automatizadas o están fuera de la organización

Desventaja de la Estrategia Top-down

115-Selecciona dos o más dimensiones de un cubo dado y proporciona un nuevo sub-cubo

Dice

19-Son las perspectivas de análisis de las variables, son catálogos de información necesarios para la presentación de los datos a los usuarios

Dimensiones

118-Bajamos a más detalle (en inglés "drill-down") en atributos de una dimensión sobre los que se ha definido una jerarquía

Drill-down

72-Procesos que leen los datos de las diferentes fuentes, los transforman y adaptan al modelo que hayamos definido, los depuran y limpian, y los introducen en la base de datos destino

ETL (Extract, Transform and Load)

73-Se deben reconciliar todos los datos de las diferentes fuentes, realizar los cálculos necesarios, mejorar la calidad de los datos, adaptarlos al nuevo modelo físico y almacenarlos en él

ETL (Extract, Transform and Load)

3-Son resultados del desarrollo de la arquitectura DW

El modelo de datos fuente, El modelo de datos conceptual DW, Arquitectura tecnológica DW, Estándares y procedimientos DW, El plan de implementación incremental para el DW

41-Algunas de las dimensiones no están relacionadas directamente con la tabla de hechos, sino que se relacionan con ella a través de otras dimensiones

Esquema en copo de nieve (snowflake schema)

42-En este caso también tenemos una tabla de hechos, situada en el centro, que contiene todas las medidas y una o varias tablas adicionales, con un mayor nivel de normalización

Esquema en copo de nieve (snowflake schema)

40-Hay una única tabla central, la tabla de hechos, que contiene todas las medidas y una tabla adicional por cada una de las perspectivas desde las que queremos analizar dicha información, es decir por cada una de las dimensiones

Esquema en estrella (Star Schema)

45-Construcción de un Data Warehouse desde la información contenida en los sistemas transaccionales

Estrategia Bottom-up

46-Genera todas las estructuras dimensionales desde las fuentes de datos de los sistemas OLTP

Estrategia Bottom-up

44-Son estrategias de Generación del Data Warehouse

Estrategia Bottom-up y Estrategia Top-down

51-Establece como paso inicial la definición de todos los requerimientos de información para los ejecutivos de la organización

Estrategia Top-down

52-Se identifican las fuentes de información que serán utilizadas para satisfacer los requerimiento definidos, dichas fuentes pueden ser sistemas transaccionales, información no automatizada y fuentes externas a la organización

Estrategia Top-down

6-Son una parte importante de la arquitectura del DW

Estándares

70-Proceso que permite a las organizaciones extraer, transformar y cargar los datos a otra fuente de información

Extract-Transform-Load (ETL)

71-Sirve principalmente para mantener una consistencia en los datos y eliminar o corregir los que estén erróneos

Extract-Transform-Load (ETL)

106-Debe ser rápido, necesitamos lanzar consultas y ver los resultados inmediatamente

FAST (Rápido)

30-Servirán para conocer el periodo de vigencia de cada una de las versiones de los atributos

Fecha de Inicio y Fecha de Fin

87-Son componentes de la arquitectura de BI

Fuentes de información, ETL, Data Warehouse

85-Que tenga registradas las operaciones de inserción, actualización y borrado que se han ido produciendo en el origen, y aplicar esos cambios en el destino; Este proceso es más eficiente y consume menos recursos en origen y destino, que hacer una lectura de dicho origen, compararlo con el destino, y obtener de ahí las diferencias para seguidamente aplicarlas al destino

Generación de tablas Delta

134-Utilizadas por desarrolladores profesionales para crear informes estándar para grupos, departamentos o la organización

Generadores de informes

90-Proveer un repositorio donde definir, documentar y gestionar la información del proceso ETL y su ejecución. El Metadata debería ser accesible también desde otras aplicaciones

Gestión del Metadata

17-Nivel de detalle que se tomará para analizar la información

Granularidad

18-Depende de los requerimientos del negocio y de los datos con los que se cuentan

Granularidad

65-Es importante a la hora de diseñar una tabla de hechos, tener en cuenta el nivel de granularidad que va a tener, es decir, el nivel de detalle más atómico que vamos a encontrar de los datos

Granularidad

66-No es lo mismo tener una fila por cada venta, que una fila donde se indiquen las ventas del día para cada artículo y tienda

Granularidad

127-Accede a los datos de alto nivel en una base de datos multidimensional

HOLAP: Hybrid OLAP

128-Accede a los datos atómicos directamente sobre la base de datos relacional

HOLAP: Hybrid OLAP

129-En esencia utiliza las ventajas del ROLAP y del MOLAP

HOLAP: Hybrid OLAP

112-Los contenidos de cada uno de los cubos individuales recogen lo que llamamos

Hechos

104-Los usuarios necesitan analizar información a distintos niveles de agregación y sobre múltiples dimensiones; Los usuarios pueden hacer este análisis al máximo nivel de agregación o al máximo nivel de detalle; A estos tipos de análisis les llamamos multidimensionales, porque nos facilitan el análisis de un hecho desde distintas perspectivas o dimensiones; La visualización de la información es independiente respecto de cómo se haya almacenado

Herramientas OLAP

136-Permiten a los usuarios finales tratar la información de forma multidimensional para explorarla desde distintas perspectivas y periodos de tiempo

Herramientas OLAP

142-Permiten a estadísticos o analistas de negocio crear modelos estadísticos de las actividades de los negocios

Herramientas datamining

137-Permiten a los usuarios finales ver información crítica para el rendimiento con un simple vistazo utilizando íconos gráficos y ver más detalle para analizar información

Herramientas de Dashboard & Scorecard

145-Estas herramientas añaden una capa de visualización sobre la que representan los valores que obtenemos de las herramientas de BI

Herramientas de Georeferencia

146-La información es representada sobre un área geográfica

Herramientas de Georeferencia

139-Permite a los analistas y a los usuarios finales crear planes de negocio y simulaciones con la información de BI

Herramientas de planificación, modelización y consolidación

140-Pueden ser para elaborar la planificación, los presupuestos, las previsiones

Herramientas de planificación, modelización y consolidación

141-Estas herramientas proveen a los dashboards y los scorecards con los objetivos y los umbrales de las métricas

Herramientas de planificación, modelización y consolidación

135-Empleadas por usuarios finales para crear informes para ellos mismos o para otros; no requieren programación

Herramientas de usuario final de consultas e informes

110-Debe poder manejar toda la información relevante y la información derivada

INFORMATION (Información):

101-Nos permite agregar o desagregar la información

Jerarquías

102-Nos permiten hacer agrupaciones

Jerarquías

103-Cambiar el orden de las distintas dimensiones en función de las necesidades de consulta

Jerarquías

59-Esto resulta en formatos múltiples de datos dentro de distintas bases, haciendo cualquier intento de consolidación imposible

La falta de estándares de datos

62-A menudo, los números de cuenta múltiples bloquean una vista consolidada. Esto puede ser el caso cuando un grupo familiar tiene a varios miembros, cada uno con su propio número de cuenta, o cuando una casa matriz tiene sucursales múltiples. Tales casos requieren capacidades investigativas fuertes para localizar y organizar la información relacionada

La miopía de datos

63-Considere las numerosas opciones disponibles para los empleados que cargan datos para ingresar un nombre de compañía, dirección, número de teléfono dentro de un campo de datos Súmese al número de abreviaciones convencionales un número igual o mayor de abreviaciones convenientes Multiplique estos por el número de campos, el número de empleados que ingresan datos, y el número de entradas reales, y usted comienza a entender la pesadilla de igualar y consolidar información compleja

La pesadilla de las anomalías

64-Esto ocurre cuando los valores de datos se desvían de los metadatos y de las reglas del negocio Por ejemplo, los nombres comerciales a menudo quedan mezclados con nombres personales; y la información de relaciones como "dba" o "c/o" se puede encontrar en una gran variedad de campos Pero simplemente porque los datos no están donde deberían, no quiere decir que son datos que usted puede ignorar

Las sorpresas de datos

86-Es importante llevar a cabo una serie de tareas de limpieza de datos y detección de incoherencias; Podemos hacer ciertas correcciones sobre datos que tenemos la certeza de que no son correctos, o simplemente no entrarlos al destino y dejarlos en algún lugar para que alguien los revise

Limpieza de datos

111-Son la representación gráfica del OLAP

Los cubos OLAP

60-Esto a menudo ocurre cuando la información no solicitada es entrada en campos de texto independiente

Los datos ocultos

61-Por la rigidez de la mayoría de los metadatos, la información "adicional" crítica es a menudo dejada de lado y necesita ser descubierta antes de ser manipulada

Los datos ocultos

124-Accede directamente sobre una base de datos multidimensional (MDDB)

MOLAP: Multidimensional OLAP

109-Tiene que proveer una visión conceptual de la información a través de distintas dimensiones

MULTIDIMENSIONAL (Multidimensional)

36-Representan columnas que contienen datos cuantificables, numéricos, que se pueden agregar. Por ejemplo, cantidad, importe, precio, margen, número de operaciones, etc.

Medidas (Measures)

88-Nos explicita todos los atributos de las tablas, de los sistemas de donde provienen, así como la definición de cada uno de los atributos de las mismas

Metadata

89-Puede incorporar también si los campos son recalculados o transformados y el detalle de las transformaciones que se han llevado a cabo

Metadata

91-Es el repositorio central de información de la información

Metadata

92-Nos da el significado de cada uno de los componentes y sus atributos que residen en el Data Warehouse (o Data Mart)

Metadata

93-Puede incluir definiciones de negocio, descripciones detalladas de los tipos de datos, formatos y otras características

Metadata

98-Este es un punto complejo de todo proyecto, ya que obliga a que se definan los conceptos de negocio y se homogenicen entre los distintos departamentos, filiales, etc.

Metadata

99-Obliga a que todos los componentes de la organización hablen utilizando la misma terminología y con el mismo significado

Metadata

37-Nos permite obtener información adicional sobre la fila, como por ejemplo, qué día se incorporó al Data Warehouse, de qué origen proviene (si tenemos varias fuentes), etc. No es necesario para el usuario de negocio, pero es interesante analizar en cada tabla de hechos que nos aporta y si merece la pena introducir algunas columnas de este tipo

Metadatos y linaje

10-Se basa en lo que Kimball denomina Ciclo de Vida Dimensional del Negocio

Metodología de Ralph Kimball

11-Propone un enfoque de menor a mayor en la construcción del DW

Metodología de Ralph Kimball

9-Serie de pasos para crear un Data Warehouse

Metodología de Ralph Kimball

13-Técnica para modelar bases de datos simples y entendibles al usuario final

Modelo Dimensional

14-La idea fundamental del es que el usuario visualice fácilmente la relación que existe entre los distintos componentes del modelo

Modelo Dimensional

4-Proveen una estructura para identificar, nombrar, describir y asociar los componentes de una base de datos

Modelos de datos

20-En este paso se tienen que identificar las medidas que surgen en el proceso de negocio

Métricas

21-Viene siendo qué es lo que se va a analizar

Métricas

22-Se colocan en una tabla llamada tabla de hechos

Métricas

83-Para conseguir una máxima escalabilidad y para afectar lo mínimo posible al rendimiento de los servidores transaccionales que van a ser nuestros orígenes de datos, debemos consumir de ellos los mínimos recursos posibles, y centrar el consumo de dichos recursos en el servidor que se encarga de realizar los procesos ETL

Mínimo impacto sobre el origen

82-Son recomendaciones para la carga de un área de staging

Mínimo impacto sobre el origen, Trazabilidad del dato, Generación de tablas Delta, Limpieza de datos

2-Integrar al DW las necesidades de información empresarial

Objetivos de las actividades de la arquitectura

116-Rota el cubo, proporcionando una vista alternativa de los datos

Pivot o Pivoting

8-Es la parte de la arquitectura de DW que identifica los incrementos del DW y describe la secuencia de desarrollo de estos incrementos

Plan de implementación

16-Define el proceso de negocio que se estará analizando

Proceso de Negocio

15-Son los pasos del ciclo de vida dimensional del negocio

Proceso de Negocio, Granularidad, Dimensiones, Métricas

119-Acceden directamente a la base de datos relacional (RDBMS).

ROLAP: Relational OLAP

120-Accede habitualmente sobre un modelo "estrella"

ROLAP: Relational OLAP

121-No tiene limitaciones en cuanto al tamaño

ROLAP: Relational OLAP

122-Es más lento que el MOLAP

ROLAP: Relational OLAP

123-Algunos productos comerciales permiten cargar cubos virtuales para acelerar los tiempos de acceso

ROLAP: Relational OLAP

117-Ver el máximo nivel de agregación (en inglés "roll-up") en atributos de una dimensión sobre los que se ha definido una jerarquía

Roll-up

38-La nueva información sobrescribe a la antigua, no se guardan históricos y sólo se tiene la versión actual. Dicha sobre escritura se produce cuando se detecta algún error en los valores para corregirlo y mejorar la calidad del dato

SCD tipo 1, sobre escritura

39-Refleja toda la información histórica. Por cada cambio que se produzca, se crea una nueva fila en la tabla de dimensiones con la fecha de inicio y una nueva clave subrogada, y se marca la fecha de fin de la versión anterior. Cada hecho que entra, debe comprobar a qué versión de la fila en la tabla de dimensiones se debe asociar en función de la fecha en la que se produzca

SCD tipo 2, historial de cambios

108-Debe apoyar el intercambio y la accesibilidad. Debe mantener la integridad de la información al proporcionar confidencialidad (seguridad) y administrar el acceso concurrente

SHARED (Compartido)

114-Selecciona una dimensión en particular de un cubo dado y proporciona un nuevo sub-cubo

Slice

31-Son tablas que representan un proceso de negocio, por ejemplo, las ventas, las compras, los pagos, los apuntes contables, los clics sobre nuestro sitio web, etc.

Tablas de Hechos

76-Asegurar que los datos sean válidos, de su integridad y de su utilidad, lo que suele incluir realizar cálculos y generar nuevos valores

Transformación de los datos

77-Los datos deben ser depurados para eliminar inconsistencias, discrepancias y duplicidades

Transformación de los datos

78-Estas transformaciones suelen conllevar cambios con respecto a la estructura de origen para adaptarla al destino, cambios en el contenido de los valores de origen y creación de nuevos valores en las filas de destino

Transformación de los datos

84-Es muy importante saber dónde, cuándo y quién ha realizado cada cambio; Realizar los procesos de extracción y de obtención de diferencias entre el origen y el destino; Ir almacenando todos los cambios que nos encontremos para poder seguir la pista de cualquier dato y de los cambios que ha sufrido

Trazabilidad del dato

125-Es muy rápida en los tiempos de respuesta

Ventaja de Molap

47-Se asegura la existencia de toda la información de los sistemas OLTP, que requiera el Data Warehouse

Ventaja de la Estrategia Bottom-up

48-Posibilita la generación de mecanismos de carga automatizados que simplifiquen las operaciones de mantenimiento y administración de la información

Ventaja de la Estrategia Bottom-up

53-El Data Warehouse resultante está realmente enfocado a las necesidades de los clientes y que apoya de forma más eficiente la toma de decisiones

Ventaja de la Estrategia Top-down

100-La existencia de las jerarquías en las dimensiones nos permite pasar del máximo detalle a la agregación en los distintos niveles

Verdadero

105-Los productos OLAP deben cumplir con el concepto FASMI

Verdadero

113-OLAP permite que cada uno de los cubos individuales pueda contener más de un hecho

Verdadero

12-La metodología de Ralph Kimball incluye la planificación, análisis de requerimientos y diseño

Verdadero

34-Al igual que en los sistemas transaccionales toda tabla debe tener una clave principal, en una tabla de hechos puede tenerla o no, y esto tiene sus pros y sus contras, pero ambas posturas son defendibles

Verdadero

5-Se necesitan modelos de datos tanto para los datos fuente como para los datos seleccionados que van a incorporarse en el DW

Verdadero

67-A mayor granularidad, mayor será el número de filas de nuestra tabla de hechos, y dado que el espacio en disco y rendimiento no se ven notablemente afectados en los sistemas actuales, debemos llegar siempre al máximo nivel de granularidad que resulte útil a los usuarios

Verdadero

7-Sin estándares, no son posibles las oportunidades para reusar y hay riesgos de que partes del desarrollo no obtengan los beneficios de la integración

Verdadero

94-La información que contiene el Metadata es útil para los departamentos de tecnología y los propios usuarios

Verdadero

97-La construcción del Metadata supone que se defina el significado de cada una de las tablas y cada uno de los atributos que se cargan en el Data Warehouse

Verdadero

95-El personal de los departamentos de Tecnología necesita saber los orígenes de la información: bases de datos de las que obtenemos los datos, qué transformaciones realizamos, criterios de filtros de información, nombre de las columnas y de las tablas, plazos de carga, utilización, etc

Verdadero (Debe conocer la Metadata)

96-Los usuarios necesitan saber las entidades y sus atributos, cómo han sido calculados, quiénes son los responsables de los datos, los informes disponibles, los flujos de distribución de la información, etc.

Verdadero (Debe también conocer cierta Metadata)

133-En este caso creamos un cubo con las dimensiones que le interesan al usuario. La ventaja es que el usuario sólo recibe los hechos y las dimensiones en los que está interesado y los analiza en forma local

Virtual o Desktop OLAP (DOLAP)

144-Son usos más habituales del datamining

segmentación, venta cruzada, hábito de consumo, clasificación, previsiones, optimizaciones, etc.

81-Es un área temporal que se encuentra en el flujo de datos entre las fuentes y el Data Mart o Data Warehouse con el fin de: Facilitar la extracción de datos, Realizar tareas de limpieza (data cleansing), Mejorar la calidad de los datos, Ser utilizada como caché de los datos operacionales o acceder a un nivel de detalle de los datos y de los cambios no almacenados en el DataMart o Data Warehouse

Área de staging


Kaugnay na mga set ng pag-aaral

Combo with "computer forensics - quiz 1" and 7 others

View Set

Chapter 2 International business

View Set

chapter nine chronic illness and disease

View Set

Segment 8: The Mortgage Loan Application

View Set

Praxis II Elementary Content Knowledge

View Set