Las 4V de Big Data
Se puede decir que el entorno Big Data tiene que tener estas cuatro características básicas:
Las Caracteristas son
Volumen de Big Data
Consiste
El volumen de datos se refiere al tamaño de los conjuntos de datos que deben ser analizados y procesados, que ahora suelen superar los terabytes y petabytes. El gran volumen de los datos requiere distintos y diferentes tecnologías de procesamiento que las capacidades tradicionales de almacenamiento y procesamiento.
Ejemplo
Un ejemplo de un gran volumen de datos conjunto serían todas las transacciones con tarjeta de crédito en un día dentro de Europa.
Ejemplo
Ahora que los datos son generados automáticamente por máquinas, redes e interacciones personales en sistemas como redes sociales (Facebook, Twitter, etc.)
Velocidad de Big Data
Consiste
La velocidad se refiere a la velocidad con la que se generan los datos. Alta velocidad los datos se generan con un ritmo tal que requiere distintos (distribuidos) técnicas de procesamiento.
Ejemplo
Un ejemplo de datos que se generan con alta la velocidad serían los mensajes de Twitter o las publicaciones de Facebook.
Ejemplo
Los datos van a suponer un input para el área de tecnología (será fundamental que se sea capaz de almacenar y digerir grandes cantidades de información).
Variedad de Big Data
Consiste
La variedad hace que Big Data sea realmente grande. Big Data proviene de una gran variedad de fuentes y generalmente es uno de tres tipos: estructurado, semiestructurado y datos no estructurados.
Ejemplo
Un ejemplo de alta variedad conjuntos de datos serían los archivos de audio y video CCTV que se generan en varios lugares de una ciudad.
Ejemplo
Poder obtener los daros de diferentes formas y técnicas: cuanta mas información de diferentes lugares, mejor!
Veracidad de Big Data
Consiste
La veracidad se refiere a la calidad de los datos que se analizan. Alto datos de veracidad tiene muchos registros que son valiosos para analizar y que contribuyen de manera significativa a los resultados generales. Datos de baja veracidad, por otro lado, contiene un alto porcentaje de datos sin sentido. Lo no valioso en estos conjuntos de datos se conocen como ruido.
Ejemplo
Un ejemplo de un conjunto de datos de alta veracidad serían datos de un experimento o ensayo médico.
Ejemplo
Verificar que los datos que obtenemos, realmente, nos sirven para tomar las decisiones en base a ellas.