CARACTERISTICAS DEL
BIG DATA
Conocidas principalmente como: Las siete V.
Son:
VOLÚMEN
Se refiere al tamaño de los conjuntos de datos que deben ser analizados y procesados.
Ejemplo:
Todas las transacciones con tarjeta de crédito en un día dentro de Europa.
VELOCIDAD
Se refiere a la velocidad con la que se reciben y procesan los datos.
Tipos:
Baja velocidad
El historial de transacciones financieras de una pequeña empresa local.
Alta velocidad
Los mensajes de Twitter o las publicaciones de Facebook son datos que se generan con alta velocidad.
VULNERABILIDAD
Se refiere a exposición de los datos ante posibles ataques cibernéticos. De ahí surge la necesidad de protección de los datos.
Ejemplo:
Ataques cibernéticos.
VISUALIZACIÓN
Se refiere al modo en que los datos son presentados.Usar cuadros y gráficos para visualizar grandes cantidades de datos complejos es mucho más efectivo para transmitir significado que hojas de cálculo e informes repletos de números.
Ejemplo:
Uso de gráficos y tablas.
VERACIDAD
Se refiere a la calidad de los datos que se analizan y a su disponibilidad.Importante:Los datos de alta veracidad tienen registros que son valiosos de analizar y aportan significativamente a los resultados generales. Los datos de baja veracidad contienen un alto porcentaje de datos sin sentido. Lo que no tiene valor en estos conjuntos de datos se denomina ruido.
Ejemplo:
Datos de un experimento o ensayos médicos.
VALOR
Se refiere a la capacidad de convertir los datos en información valiosa para la buena toma de decisiones.
Ejemplo:
Utilizar la información de horario de mayor visitas en una página web para lanzar promociones de los productos de una empresa.
VARIEDAD
Se refiere a los distintos tipos de datos que se encuentran disponibles y a su naturaleza.
Tipos:
D. ESTRUCTURADOS
Se refiere a los datos con longitud y formato definidos. Ej. números y fechas.
D. SEMI ESTRUCTURADOS
Se refiere a la forma de datos que está estructurada pero no está definida.Ej. Textos de redes sociales, videos, imágenes y registros de llamada.
D. NO ESTRUCTURADOS
Se refiere a los datos que no se ajustan a un formato tabular y no se pueden organizar fácilmente en filas y columnas.Ej. Los comentarios de diferentes usuarios en una plataforma de streaming.
Ejemplo:
Un ejemplo de conjuntos de datos de gran variedad son los archivos de audio y vídeo de CCTV que se generan en varios lugares de una ciudad.