Fundamentos Big Data
Principales impulsores de Big Data
"Analítica y ciencia de los datos, Digitalización, Tecnología asequible y hardware de productos de consumo. Los medios de comunicación social,Comunidades y dispositivos hiperconectados, Computación en la nube "
Tipos de dato Big Data
"Estructurado , Desestructurado , Semiestructurada"
¿Qué tipo de datos procesados por las soluciones de Big Data tiene la menor relación ruido/señal?
"Estructurados
¿Cuáles son los tres tipos de datos que las soluciones de Big Data requieren para poder procesarlos?
"Estructurados, No estructurados, Semiestructurados
¿Cuáles son las cinco características de los datos que pueden ser procesados por las soluciones de " Big Data "?
"Volumen, Velocidad, Variedad, Veracidad, Valor"
Desestructurado
Cualquier dato con forma o estructura desconocida se clasifica como dato no estructurado.
KPI
Mediciones ligadas a objetivos estrategicos de la organización
Analítica
¿Qué disciplina se utiliza para analizar los datos utilizando técnicas de cientificas y herramientas automatizadas con el fin de encontrar patrones ocultos y correlaciones?
OLTP / Online Transaction Procesing
¿Qué tipo de sistema almacena datos operacionales normalizados que pueden ser utilizados como entrada analítica estructurada para grandes soluciones de datos?
OLAP
¿Qué tipo de sistemas se utilizan en el análisis diagnóstico, predictivo y prescriptivo y pueden servir como fuente de datos para las soluciones de Big Data?
Características de Big Data
Volumen, velocidad, Variedad, valor, y veracidad
Cuanto ________ sea la fidelidad de los datos, más valor tiene para la empresa
mayor
Análisis cualitatitivo
¿Cuál es la técnica de análisis en la que una pequeña muestra de datos es analizada con mayor profundidad para describir las diferentes cualidades de los datos utilizando palabras en lugar de números?
Análisis cualitativo
¿Cuál es la técnica de análisis en la que una pequeña muestra de datos es analizada con mayor profundidad para describir las diferentes cualidades de los datos utilizando palabras en lugar de números?
Análisis cuantitativo
¿Cuál es la técnica de análisis que cuantifica los patrones y correlaciones encontrados en una gran muestra de un conjunto de datos?
Supervisado y No supervisado
¿Cuáles son los dos tipos principales de Machine Learning?
Machine learning
¿Cómo se sabe que los algoritmos pueden modificar el comportamiento de la computadora usando un ciclo de retroalimentación?
Analítica
¿Qué disciplina analiza los datos utilizando técnicas de cientificas y herramientas automatizadas con el fin de encontrar patrones ocultos y correlaciones?
¿Cuáles son los cuatro tipos principales de métodos analíticos?
"descriptivo, diagnostico, predictivo, prescriptivo
¿Qué es el Big Data?
Big Data también es información pero con un tamaño enorme . Big Data es un término utilizado para describir una recopilación de datos de gran tamaño y, sin embargo, que crece exponencialmente con el tiempo. En resumen, tales datos son tan grandes y complejos que ninguna de las herramientas tradicionales de administración de datos puede almacenarlos o procesarlos de manera eficiente.
Estructurado
Cualquier dato que se pueda almacenar, acceder y procesar en forma de formato fijo se denomina datos 'estructurados'.
Analítica
Es el análisis computacional sistemático de datos o estadísticas.
Análisis
Es el examen detallado de los elementos o la estructura de algo
Terabyte
Es una unidad de medida informática cuyo símbolo es el TB, y es equivalente a 2 a la 40 bytes. Comúnmente se acepta que un terabyte es equivalente a 1,000gb lo cual implica 1,000,000 de Mb. Se acuño desde 1960, viene del griego τέρας, que significa monstruo
Mediciones ligadas a objetivos estratégicos de la organización
KPI (Key performance indicators)
KPI
Key performance indicators
¿Qué son los datos?
Las cantidades, caracteres o símbolos en los que una computadora realiza las operaciones, que pueden almacenarse y transmitirse en forma de señales eléctricas y grabarse en medios de grabación magnéticos, ópticos o mecánicos.
Conjunto de datos
Las colecciones o grupos de datos relacionados se denominan generalmente conjuntos de datos o dataset. Cada grupo o miembro de un conjunto de datos, a veces denominado "datum", comparte el mismo conjunto de atributos que otros en el mismo conjunto de datos.
Dataset
Las colecciones o grupos de datos relacionados se denominan generalmente conjuntos de datos o dataset. Cada grupo o miembro de un conjunto de datos, a veces denominado "datum", comparte el mismo conjunto de atributos que otros en el mismo conjunto de datos.
Semiestructurada
Los datos semiestructurados pueden contener ambas formas de datos. Podemos ver datos semiestructurados que aparentan ser estructurados, pero en realidad no tiene una estructura definida.
1 zettabyte
Mil millones de terabytes ó 10 elevado a la 21 bytes
OLTP
Online Transaction Procesing / Procesamiento de transacciones en línea
OLAP
Online analytical procesing / Procesamiento analítico en línea
Analítica
Puede utilizarse para automatizar el análisis de datos mediante la minería de datos, el aprendizaje automático, el análisis estadístico y las técnicas de análisis cuantitativo