Kategorier: Alle - veracidad - variedad - datos - procesamiento

af MARIA FERNANDA RADA VERGARA 1 år siden

98

LAS 4V's DEL BIG DATA

El concepto de Big Data se refiere a la recopilación, análisis y procesamiento de grandes cantidades de datos que se generan a alta velocidad, tienen una gran variedad y requieren técnicas avanzadas para extraer información significativa.

LAS 4V's DEL BIG DATA

LAS 4V's DEL BIG DATA

Se define como un conjunto de caracteres unidos de forma lógica.

Nota: Los datos de gran volumen, alta velocidad y gran variedad deben ser

procesado con herramientas avanzadas (análisis y algoritmos) para revelar información significativa, a toda esta acción, mas el análisis de todos estos datos se ha denominado Big Data.

son

VERACIDAD

Se refiere a la calidad de los datos que se analizan.


existen

DATOS DE BAJA VERACIDAD

Contienen un alto porcentaje de datos sin sentido

DATOS DE ALTA VERACIDAD

Contienen bastantes registros son valiosos para analizar y contribuyen de manera significativa a los resultados generales.

Datos de un experimento o ensayo médico

VARIEDAD
tipos

NO ESTRUDTURADOS

SEMI-ESTRUCTURADOS

ESTRUCTURADOS

Archivos de audio y video de CCTV generados varios lugares de una ciudad.

ALGORITMOS ESPECIALES

DISTINTAS CAPACIDADES DE PROCESAMIENTO

VOLUMEN

Se refiere al tamaño de los conjuntos de datos que van a ser analizados y procesados, frecuentemente más grandes que terabytes y petabytes.

requiere

TECNOLOGIAS DE PROCESAMIENTO ESPECIALES

Tecnologías de procesamiento distintas y diferentes a las capacidades tradicionales de almacenamiento y procesamiento

Transacciones con tarjeta de crédito en un día dentro de Europa

Un ejemplo de un conjunto de datos de gran volumen.

VELOCIDAD

Se refiere a la velocidad con la que se generan los datos

necesitan

TECNICAS DE PROCESAMIENTO DISTINTAS

Debido al ritmo en el que se generan los datos de alta velocidad.

Ejemplo

Post de Facebook