LAS 4 V DE BIG DATA

r

El dominio de conocimiento que se ocupa del almacenamiento, procesamiento y análisis del conjuntos de datos se ha denominado Big Data

VOLUMEN

r

Suelen superar los terabytes y petabytes 

Se refiere

r

El volumen de datos se refiere al tamaño de los conjuntos de datos que deben ser analizados y procesados

CONJUNTO DE DATOS

r

Esto significa que los conjuntos de datos en Big Data son demasiado grandes para procesar con un ordenador portátil normal o un procesador de escritorio.

Ejemplo

r

Un ejemplo de un gran volumen de datos serían todas las transacciones con tarjeta de crédito en un día dentro de Europa. 

VERACIDAD

r

Calidad de los datos que se analizan.

Datos de

ALTA VERACIDAD

r

Los datos de alta veracidad tienen muchos registros que son valiosos para analizar y que contribuyen de manera significativa a los resultados generales.

BAJA VERACIDAD

r

Los datos de baja veracidad contienen un alto porcentaje de datos sin sentido. 

Ejemplo

r

Un ejemplo de un conjunto de datos de alta veracidad serían datos de un experimento o ensayo médico.

VARIEDAD

r

La variedad de tipos de datos requiere con frecuencia distintas capacidades de procesamiento y algoritmos especializados.

Ejemplo

r

Un ejemplo de conjuntos de datos de gran variedad serían los archivos de audio y video de CCTV que se generan en varios lugares de una ciudad. 

Impacto

r

La variedad hace que Big Data sea realmente grande. Big Data proviene de una gran variedad de fuentes.

Tipos

ESTRUCTURADOS

SEMI-ESTRUCTURADOS

NO ESTRUCTURADOS

VELOCIDAD

r

Requieren distintas técnicas de procesamiento

Se refiere

r

La velocidad se refiere a la velocidad con la que se generan los datos

Ejemplo

r

Un ejemplo de datos que se generan con alta la velocidad serían los mensajes de Twitter o las publicaciones de Facebook. 

Facebook

Facebook

twitter

twitter