Категории: Все - veracidad - variedad - datos - análisis

по LUIS DIEGO FERNANDEZ JIMENEZ 1 года назад

168

Las 4V de Big Data

En el entorno del Big Data, existen cuatro características fundamentales que definen su naturaleza: velocidad, variedad, veracidad y volumen. La velocidad se refiere a la rapidez con la que se generan y procesan los datos, lo que requiere técnicas avanzadas de procesamiento distribuido.

Las 4V de Big Data

Las 4V de Big Data

Se puede decir que el entorno Big Data tiene que tener estas cuatro características básicas:

Las Caracteristas son

Veracidad de Big Data

La veracidad se refiere a la calidad de los datos que se analizan. Alto datos de veracidad tiene muchos registros que son valiosos para analizar y que contribuyen de manera significativa a los resultados generales. Datos de baja veracidad, por otro lado, contiene un alto porcentaje de datos sin sentido. Lo no valioso en estos conjuntos de datos se conocen como ruido. 

Verificar que los datos que obtenemos, realmente, nos sirven para tomar las decisiones en base a ellas.

Un ejemplo de un conjunto de datos de alta veracidad serían datos de un experimento o ensayo médico.

Variedad de Big Data

La variedad hace que Big Data sea realmente grande. Big Data proviene de una gran variedad de fuentes y generalmente es uno de tres tipos: estructurado, semiestructurado y datos no estructurados.

Poder obtener los daros de diferentes formas y técnicas: cuanta mas información de diferentes lugares, mejor!

Un ejemplo de alta variedad conjuntos de datos serían los archivos de audio y video CCTV que se generan en varios lugares de una ciudad.

Velocidad de Big Data

La velocidad se refiere a la velocidad con la que se generan los datos. Alta velocidad los datos se generan con un ritmo tal que requiere distintos (distribuidos) técnicas de procesamiento.

Los datos van a suponer un input para el área de tecnología (será fundamental que se sea capaz de almacenar y digerir grandes cantidades de información).

Un ejemplo de datos que se generan con alta la velocidad serían los mensajes de Twitter o las publicaciones de Facebook.

Volumen de Big Data
Consiste

El volumen de datos se refiere al tamaño de los conjuntos de datos que deben ser analizados y procesados, que ahora suelen superar los terabytes y petabytes. El gran volumen de los datos requiere distintos y diferentes tecnologías de procesamiento que las capacidades tradicionales de almacenamiento y procesamiento.

Ahora que los datos son generados automáticamente por máquinas, redes e interacciones personales en sistemas como redes sociales (Facebook, Twitter, etc.)

Ejemplo

Un ejemplo de un gran volumen de datos conjunto serían todas las transacciones con tarjeta de crédito en un día dentro de Europa.