jonka LUIS DIEGO FERNANDEZ JIMENEZ 1 vuosi sitten
168
Lisää tämän kaltaisia
Se puede decir que el entorno Big Data tiene que tener estas cuatro características básicas:
La veracidad se refiere a la calidad de los datos que se analizan. Alto datos de veracidad tiene muchos registros que son valiosos para analizar y que contribuyen de manera significativa a los resultados generales. Datos de baja veracidad, por otro lado, contiene un alto porcentaje de datos sin sentido. Lo no valioso en estos conjuntos de datos se conocen como ruido.
Verificar que los datos que obtenemos, realmente, nos sirven para tomar las decisiones en base a ellas.
Un ejemplo de un conjunto de datos de alta veracidad serían datos de un experimento o ensayo médico.
La variedad hace que Big Data sea realmente grande. Big Data proviene de una gran variedad de fuentes y generalmente es uno de tres tipos: estructurado, semiestructurado y datos no estructurados.
Poder obtener los daros de diferentes formas y técnicas: cuanta mas información de diferentes lugares, mejor!
Un ejemplo de alta variedad conjuntos de datos serían los archivos de audio y video CCTV que se generan en varios lugares de una ciudad.
La velocidad se refiere a la velocidad con la que se generan los datos. Alta velocidad los datos se generan con un ritmo tal que requiere distintos (distribuidos) técnicas de procesamiento.
Los datos van a suponer un input para el área de tecnología (será fundamental que se sea capaz de almacenar y digerir grandes cantidades de información).
Un ejemplo de datos que se generan con alta la velocidad serían los mensajes de Twitter o las publicaciones de Facebook.
El volumen de datos se refiere al tamaño de los conjuntos de datos que deben ser analizados y procesados, que ahora suelen superar los terabytes y petabytes. El gran volumen de los datos requiere distintos y diferentes tecnologías de procesamiento que las capacidades tradicionales de almacenamiento y procesamiento.
Ahora que los datos son generados automáticamente por máquinas, redes e interacciones personales en sistemas como redes sociales (Facebook, Twitter, etc.)
Ejemplo
Un ejemplo de un gran volumen de datos conjunto serían todas las transacciones con tarjeta de crédito en un día dentro de Europa.