La veracidad se refiere a la calidad de los datos que se analizan.
rLos datos de alta veracidad tienen muchos registros que son valiosos para analizar y que contribuyen de manera significativa a los resultados generales. Los datos de baja veracidad, por otro lado, contienen un alto porcentaje de datos sin sentido. Lo no valioso en estos conjuntos de datos se denomina ruido. Un ejemplo de un conjunto de datos de alta veracidad serían los datos de un experimento o ensayo médico. Los datos de gran volumen, alta velocidad y gran variedad deben ser procesado con herramientas avanzadas (análisis y algoritmos) para revelar información significativa.
El volumen se refiere a la cantidad de datos que son generados cada segundo, minuto y días en nuestro entorno.
rEl volumen de datos se refiere al tamaño de los conjuntos de datos que deben ser analizados y procesados, que ahora suelen superar los terabytes y petabytes. El gran volumen de los datos requiere distintas y diferentestecnologías de procesamiento que las capacidades tradicionales de almacenamiento y procesamiento. EnEn otras palabras, esto significa que los conjuntos de datos en Big Data son demasiado grandes para procesarlos.con un ordenador portátil normal o un procesador de escritorio. Un ejemplo de un gran volumen de datosconjunto serían todas las transacciones con tarjeta de crédito en un día dentro de Europa.
rTodo este tiempo atrás, los datos se han obtenido de forma manual, sin la ayuda de ninguna máquina ni tecnología que facilite este trabajo. Sin embargo, si hubiera que analizar el volumen masivo de datos ahora, hacerlo manualmente llevaría mucho tiempo y no se haría con exactitud. Seguramente, muchos de esos datos se perderían.