BIG DATA Y MINERÍA DE DATOS

Big data se refiere a una gran cantidad de datos

esta técnica o tendencia de manejo de información se refiere a un volumen grande de datos, que involucran 5 atributos denotados como 5 Vs, las cuales son:

Volumen o tamaño de datos, que regularmente son iguales o mayores a 1 Tb

Variedad de tipos de datos como redes sociales, registros del servidor web, etc

Velocidad o qué tan rápido crecen los datos

Veracidad o incertidumbre de los datos como las redes sociales significa si los datos pueden ser confiables o no

Valor: se refiere a los datos que estamos almacenando y si el procesamiento vale la pena y cómo nos estamos beneficiando de esta gran cantidad de datos.

Todo, desde nuestros teléfonos inteligentes hasta nuestras plantas de manufactura o incluso los refrigeradores y colchones con sensores, están produciendo datos a cada momento, el reto es cómo recomponer esta en información útil, dándole sentido, esta técnica o tendencia de manejo de información se refiere a un volumen grande de datos

minería de datos se refiere a un drive profundo en los datos para extraer el conocimiento clave o información de una determinada cantidad de datos

proceso de extraer información, analizar los grandes volúmenes de datos, sintetizando, identificando y agrupando patrones de comportamiento entre los datos normalmente muy grandes y heterogéneos

se trata de la actividad de analizar grandes conjuntos de datos para entender, confirmar o predecir un comportamiento

5 NIVELES

Extraer, transformar y cargar datos en el almacén

Almacenar y administrar

Proporcionar acceso a datos (Comunicación)

Analizar (Proceso)

Interfaz de usuario (presentar datos al usuario.

Wall Disney hacía uso de Big Data para el análisis de rutas de us clientes y mejorar su experiencia en tiempo real

Data Mining es un conjunto de técnicas de extracción de datos para detectar patrones de comportamiento a través de algoritmos matemáticos

Permite conocer patrones de conducta, periodos de contratación o compra de un servicio determinado, fuga a otras compañías, o incluso riesgos de estafas a partir de patrones sospechosos o inusuales

Generalmente los datos que se analizan pertenecen a clientes y consumidores.

Se usa principalmente en la estadística, el aprendizaje automático e inteligencia artificial.

el objetivo principal del Data Mining es la clasificación o predicción de datosData Mining analiza la información para conocer y descubrir patrones de conducta sospechosos