Categorías: Todo - veracidad - variedad - datos - procesamiento

por WILNER JESUS JIMENEZ GONZALEZ hace 2 meses

129

LAS 4 V DE BIG DATA

El concepto de Big Data se centra en la gestión de grandes volúmenes de datos, que pueden superar los terabytes y petabytes, y que requieren de una infraestructura especial para ser procesados.

LAS 4 V DE BIG DATA

LAS 4 V DE BIG DATA

El dominio de conocimiento que se ocupa del almacenamiento, procesamiento y análisis del conjuntos de datos se ha denominado Big Data

VELOCIDAD

Requieren distintas técnicas de procesamiento

Un ejemplo de datos que se generan con alta la velocidad serían los mensajes de Twitter o las publicaciones de Facebook. 

twitter
Facebook

La velocidad se refiere a la velocidad con la que se generan los datos

VARIEDAD

La variedad de tipos de datos requiere con frecuencia distintas capacidades de procesamiento y algoritmos especializados.


Impacto

La variedad hace que Big Data sea realmente grande. Big Data proviene de una gran variedad de fuentes.

Tipos

ESTRUCTURADOS

SEMI-ESTRUCTURADOS

NO ESTRUCTURADOS

Un ejemplo de conjuntos de datos de gran variedad serían los archivos de audio y video de CCTV que se generan en varios lugares de una ciudad. 

VERACIDAD

Calidad de los datos que se analizan.

Ejemplo

Un ejemplo de un conjunto de datos de alta veracidad serían datos de un experimento o ensayo médico.

Datos de
BAJA VERACIDAD

Los datos de baja veracidad contienen un alto porcentaje de datos sin sentido. 

ALTA VERACIDAD

Los datos de alta veracidad tienen muchos registros que son valiosos para analizar y que contribuyen de manera significativa a los resultados generales.

VOLUMEN

Suelen superar los terabytes y petabytes 

Ejemplo

Un ejemplo de un gran volumen de datos serían todas las transacciones con tarjeta de crédito en un día dentro de Europa. 

Se refiere

El volumen de datos se refiere al tamaño de los conjuntos de datos que deben ser analizados y procesados

CONJUNTO DE DATOS

Esto significa que los conjuntos de datos en Big Data son demasiado grandes para procesar con un ordenador portátil normal o un procesador de escritorio.