Kategorier: Alle - veracidad - variedad - datos - volumen

af Juan david Jimenez 10 måneder siden

66

bíg data

La gestión de grandes volúmenes de información, conocida como big data, se caracteriza por su complejidad y tamaño, superando las capacidades de las herramientas tradicionales de recolección y análisis de datos.

bíg data

bíg data

conjunto de información muy grande y complicada que sobrepasen la habilidad de los instrumentos de recolección de información tradicional.

REFERENCIAS



Herramientas

Spark

Motor de funcionamiento de datos en memoria que apoya el análisis rápido y eficaz de un gran número de datos.


Ejemplo: Una compañía que hace análisis financieros utiliza Spark para realizar cálculos complejos en tiempo real sobre la información financiera de transacciones, esto se hace con el fin de aumentar la rapidez y la fiabilidad del estudio.

NosQl

Sistemas de gestión de bases de datos diseñados para manejar grandes cantidades de datos no estructurados o semiestructurados.


Ejemplo: Una plataforma de redes sociales utiliza una base de datos NoSQL para almacenar y recuperar información de perfiles de usuarios, que incluye datos diversos como texto, imágenes y relaciones de amistad.

Hadoop

Es un marco de trabajo que proporciona un alojamiento y un tratamiento de datos grande para grupos de computadoras.


Ejemplo: Una compañía de comercio electrónico usa Hadoop para examinar las formas en que los clientes compran, para así poder aconsejarle de manera particular.

Tipos de datos

semi-estructurados

Incluyen componentes de sustento, pero no logran totalmente una estructura firme. Regularmente, poseen ciertas insignias o identificadores que posibilitan un cierto grado de ordenación.


Ejemplo: Archivos de texto o de números que tienen una forma determinada, pero es posible que contengan información variable. Además, procedimientos para la administración de texto con encabezados y tablas, sin embargo, con posibilidades en el tema.

no estructurado

La información es a veces llamada de manera errónea como basura. Es posible que incluyan narración, imágenes, videos y distintos tipos de información que no se acomodan a una estructura preestablecida.


Ejemplo: Diarios en internet, fotografías compartidas en ambientes en línea, o documentos de registro de acontecimientos con una particularidad específica.

estructurado

 la información está registrada en tablas que tienen una estructura preestablecida y vínculos aparentes entre las partes. La información se encuentra clasificada por categorías, esto hace más fácil la preservación y acceso a la misma.


Ejemplo: Una base de datos de clientes de una compañía que tiene campos para nombre, dirección, número de teléfono y fecha de compra.

Características

Veracidad

En las operaciones de dinero, la fiabilidad de que los datos reflejen precisamente las operaciones económicas es fundamental.


ejemplo: La fiabilidad en este contexto se refiere a la preservación de la seriedad de los datos con el fin de tomar decisiones importantes en el ámbito de los financieros

variedad

se evidencia por la variedad de clases de datos, que incluyen datos que están estructuradas, no estructuradas y semi-estructuradas.


ejemplo: la variedad se evidencia en la mezcla de información genética esto genera una amalgama que rompe con las soluciones de información tradicionales.

velocidad

como la rapidez con la que se generan, analizan y se conforman los datos. En ambientes como el Internet de las cosas (iOT).


ejemplo: en el monitoreo de la salud a través de tecnología vestible (APPLE WATCH), la información se genera en tiempo real y requiere un tratamiento rápido para poder obtener información valiosa y respuestas interesantes.

volumen

se refiere a la inmensa diversidad de información que se genera y se amontonan constantemente.


ejemplo: sobresaliente es el estudio de información de redes sociales, donde los usuarios de millones de personas generan constantemente reels, publicaciones, comentarios, conformando una enorme base de datos