Kategorier: Alle - variedad - datos - procesamiento - volumen

af byron theran 1 år siden

166

4 Vs DEL BIG DATA

Big Data representa un conjunto de grandes volúmenes de datos que se generan y procesan a una velocidad impresionante, lo que hace que los datos obsoletos sean rápidamente reemplazados por información más reciente.

4 Vs DEL BIG DATA

4 Vs DEL BIG DATA

Las características de Big Data se conocen comúnmente como las cuatro V:

VELOCIDAD
Los datos se generan a una gran velocidad. Por ese motivo, muchos de ellos quedarán obsoletos en cuestión de poco tiempo y perderán su valor cuando aparezcan otros más recientes.
VOLUMEN
El volumen se refiere a la cantidad de datos que son generados cada segundo, minuto y días en nuestro entorno.

El volumen de datos se refiere al tamaño de los conjuntos de datos que deben ser analizados y procesados, que ahora suelen superar los terabytes y petabytes.

El gran volumen de los datos requiere distintas y diferentes

tecnologías de procesamiento que las capacidades tradicionales de almacenamiento y procesamiento. En

En otras palabras, esto significa que los conjuntos de datos en Big Data son demasiado grandes para procesarlos.

con un ordenador portátil normal o un procesador de escritorio. Un ejemplo de un gran volumen de datos

conjunto serían todas las transacciones con tarjeta de crédito en un día dentro de Europa.

ejemplo

VERACIDAD
La veracidad se refiere a la calidad de los datos que se analizan.

Los datos de alta veracidad tienen muchos registros que son valiosos para analizar y que contribuyen de manera significativa a los resultados generales. Los datos de baja veracidad, por otro lado, contienen un alto porcentaje de datos sin sentido. Lo no valioso en estos conjuntos de datos se denomina ruido. Un ejemplo de un conjunto de datos de alta veracidad serían los datos de un experimento o ensayo médico. Los datos de gran volumen, alta velocidad y gran variedad deben ser procesado con herramientas avanzadas (análisis y algoritmos) para revelar información significativa.

VARIEDAD

La variedad requiere con frecuencia distintas capacidades de procesamiento y algoritmos especializados.

Se compone de 3 tipos

SEMIESTRUCTURADO

NO ESTRUCTURADO

ESTRUCTURADO