CARACTERISTICAS DEL
BIG DATA

r

Conocidas principalmente como: Las siete V.

Son:

VOLÚMEN

r

Se refiere al tamaño de los conjuntos de datos que deben ser analizados y procesados.

Ejemplo:

r

Todas las transacciones con tarjeta de crédito en un día dentro de Europa.

VELOCIDAD

r

Se refiere a la velocidad con la que se reciben y procesan los datos.

Tipos:

Baja velocidad

r

El historial de transacciones financieras de una pequeña empresa local. 

Alta velocidad

r

Los mensajes de Twitter o las publicaciones de Facebook son datos que se generan con alta velocidad.

VULNERABILIDAD

r

Se refiere a exposición de los datos ante posibles ataques cibernéticos. De ahí surge la necesidad de protección de los datos.

Ejemplo:

r

Ataques cibernéticos.

VISUALIZACIÓN

r

Se refiere al modo en que los datos son presentados.Usar cuadros y gráficos para visualizar grandes cantidades de datos complejos es mucho más efectivo para transmitir significado que hojas de cálculo e informes repletos de números.

Ejemplo:

r

Uso de gráficos y tablas.

VERACIDAD

r

Se refiere a la calidad de los datos que se analizan y a su disponibilidad.Importante:Los datos de alta veracidad tienen registros que son valiosos de analizar y aportan significativamente a los resultados generales. Los datos de baja veracidad contienen un alto porcentaje de datos sin sentido. Lo que no tiene valor en estos conjuntos de datos se denomina ruido.

Ejemplo:

r

Datos de un experimento o ensayos médicos.

VALOR

r

Se refiere a la capacidad de convertir los datos en información valiosa para la buena toma de decisiones.

Ejemplo:

r

Utilizar la información de horario de mayor visitas en una página web para lanzar promociones de los productos de una empresa.

VARIEDAD

r

Se refiere a los distintos tipos de datos que se encuentran disponibles y a su naturaleza. 

Tipos:

D. ESTRUCTURADOS

r

Se refiere a los datos con longitud y formato definidos. Ej. números y fechas.

D. SEMI ESTRUCTURADOS

r

Se refiere a la forma de datos que está estructurada pero no está definida.Ej. Textos de redes sociales, videos, imágenes y registros de llamada.

D. NO ESTRUCTURADOS

r

Se refiere a los datos que no se ajustan a un formato tabular y no se pueden organizar fácilmente en filas y columnas.Ej. Los comentarios de diferentes usuarios en una plataforma de streaming.

Ejemplo:

r

Un ejemplo de conjuntos de datos de gran variedad son los archivos de audio y vídeo de CCTV que se generan en varios lugares de una ciudad.

Topic flotante