MACHINE LEARNING

c1r

Machine Learning es como se conoce a un conjunto de técnicas que permiten a los ordenadores aprender a partir de los datos. Actualmente se ha convertido en una disciplina científica, académica y profesional.

Aprendizaje no
supervisado

c1r

Conjunto de técnicas que tratan de identificar patrones organizativos entre los datos sin que haya un criterio de comparación que permita supervisar el proceso de organización.

K-Means

Aprendizaje
supervisado

c1r

Son un grupo de técnicas que permiten relacionar un conjunto de variables atributos o características con una variable dependiente o criterio conocida como "target". Este grupo de técnicas generan una función que trata de predecir el valor del target para cada caso, a partir de la combinación del resto de variables atributos.

Regresión Lineal

Regresión Logística

Árboles de Decisión

Data Wrangling

r

Data Wrangling (DW) es un proceso donde se transforman los datos en bruto para que puedan ser útiles posteriormente para ser almacenados y analizados:Perfilado: acciones para identificar el contenido de los datos y valorar si son de calidad.Individual: analiza la calidad de un conjunto de datos uno por uno.Verificación sintáctica: analizar si los datos están dentro del rango de valor correcto.Verificación semántica: analizar si los datos están relacionados con el significado que se le atribuye al campo.Conjunto: analizar la distribución de un campo y la relación entre campos.Estadística general: análisis del conjunto de datos.Visualización: representación gráfica de los datos.Transformación: modificación de los datos para mejorar su operatividad.Estructurar: modificar la estructura de los datos.Operación intra-registro: modifica los campos individualmente.Operación inter-registro: modifica varios campos a la vez.Extracción de valores: generar nuevos campos a partir de los anteriores.Enriquecer: incluir nueva información a un conjunto de datos.Unión: combinar dos o más conjuntos de datos en uno.Joins: añadir un campo de una tabla a otra tabla.Insertar metadatos: insertar información que describe a los datos.Variables derivadas: generar valores en un campo a partir de otros campos.Limpiar: eliminar o corregir datos erróneos.

Perfilado

Individual

Verificación sintáctica

Verificación semántica

Conjunto

Estadística general

Visualización

Transformación

Estructurar

Operaciones intra-registro

Operaciones inter-registro

Extracción de valores

Enriquecer

Unión

Joins

Insertar metadatos

Variables derivadas

Limpiar