Las 4V de Big Data

r

Se puede decir que el entorno Big Data tiene que tener estas cuatro características básicas:

Las Caracteristas son

Volumen de Big Data

Consiste

r

El volumen de datos se refiere al tamaño de los conjuntos de datos que deben ser analizados y procesados, que ahora suelen superar los terabytes y petabytes. El gran volumen de los datos requiere distintos y diferentes tecnologías de procesamiento que las capacidades tradicionales de almacenamiento y procesamiento.

Ejemplo

Ejemplo

r

Un ejemplo de un gran volumen de datos conjunto serían todas las transacciones con tarjeta de crédito en un día dentro de Europa.

Ejemplo

Ejemplo

r

Ahora que los datos son generados automáticamente por máquinas, redes e interacciones personales en sistemas como redes sociales (Facebook, Twitter, etc.)

Velocidad de Big Data

Consiste

r

La velocidad se refiere a la velocidad con la que se generan los datos. Alta velocidad los datos se generan con un ritmo tal que requiere distintos (distribuidos) técnicas de procesamiento.

Ejemplo

Ejemplo

r

Un ejemplo de datos que se generan con alta la velocidad serían los mensajes de Twitter o las publicaciones de Facebook.

Ejemplo

Ejemplo

r

Los datos van a suponer un input para el área de tecnología (será fundamental que se sea capaz de almacenar y digerir grandes cantidades de información).

Variedad de Big Data

Consiste

r

La variedad hace que Big Data sea realmente grande. Big Data proviene de una gran variedad de fuentes y generalmente es uno de tres tipos: estructurado, semiestructurado y datos no estructurados.

Ejemplo

Ejemplo

r

Un ejemplo de alta variedad conjuntos de datos serían los archivos de audio y video CCTV que se generan en varios lugares de una ciudad.

Ejemplo

Ejemplo

r

Poder obtener los daros de diferentes formas y técnicas: cuanta mas información de diferentes lugares, mejor!

Veracidad de Big Data

Consiste

r

La veracidad se refiere a la calidad de los datos que se analizan. Alto datos de veracidad tiene muchos registros que son valiosos para analizar y que contribuyen de manera significativa a los resultados generales. Datos de baja veracidad, por otro lado, contiene un alto porcentaje de datos sin sentido. Lo no valioso en estos conjuntos de datos se conocen como ruido. 

Ejemplo

Ejemplo

r

Un ejemplo de un conjunto de datos de alta veracidad serían datos de un experimento o ensayo médico.

Ejemplo

Ejemplo

r

Verificar que los datos que obtenemos, realmente, nos sirven para tomar las decisiones en base a ellas.