LAS 4 V DE BIG DATA
El dominio de conocimiento que se ocupa del almacenamiento, procesamiento y análisis del conjuntos de datos se ha denominado Big Data
VOLUMEN
Suelen superar los terabytes y petabytes
Se refiere
El volumen de datos se refiere al tamaño de los conjuntos de datos que deben ser analizados y procesados
CONJUNTO DE DATOS
Esto significa que los conjuntos de datos en Big Data son demasiado grandes para procesar con un ordenador portátil normal o un procesador de escritorio.
Ejemplo
Un ejemplo de un gran volumen de datos serían todas las transacciones con tarjeta de crédito en un día dentro de Europa.
VERACIDAD
Calidad de los datos que se analizan.
Datos de
ALTA VERACIDAD
Los datos de alta veracidad tienen muchos registros que son valiosos para analizar y que contribuyen de manera significativa a los resultados generales.
BAJA VERACIDAD
Los datos de baja veracidad contienen un alto porcentaje de datos sin sentido.
Ejemplo
Un ejemplo de un conjunto de datos de alta veracidad serían datos de un experimento o ensayo médico.
VARIEDAD
La variedad de tipos de datos requiere con frecuencia distintas capacidades de procesamiento y algoritmos especializados.
Ejemplo
Un ejemplo de conjuntos de datos de gran variedad serían los archivos de audio y video de CCTV que se generan en varios lugares de una ciudad.
Impacto
La variedad hace que Big Data sea realmente grande. Big Data proviene de una gran variedad de fuentes.
Tipos
ESTRUCTURADOS
SEMI-ESTRUCTURADOS
NO ESTRUCTURADOS
VELOCIDAD
Requieren distintas técnicas de procesamiento
Se refiere
La velocidad se refiere a la velocidad con la que se generan los datos
Ejemplo
Un ejemplo de datos que se generan con alta la velocidad serían los mensajes de Twitter o las publicaciones de Facebook.