Los principales aspectos del aprendizaje máquina supervisado
Conocido como "Supervised machine learning"
Basado en
Se produce cuando se entrena
a las máquinas con datos etiquetados,
permite tomar decisiones o hacer prediciones
Buscar patrones en datos históricos
relacionado con campo objetivo
Learning - training
Detecta patrones de un conjunto de datos.
Dataset
Materia prima del sistema de predicción
Se utiliza para estrenar al sistema en el histórico de datos
Ejemplos
Enumeración o conjunto finito de clases
Análisis de comportamiento de
clientes en sus procesos de compra,
se les hace recomendaciones de compra
Aplicación que distinga entre millones
de animales con base en imágenes y
descripciones escritas
Métodos
Clasificación
Encuentra diferentes patrones y
clasifica los elementos en grupos
Predicciones
Meteorológicas
Expectativa de vida
Crecimiento
Se utiliza la variable objetivo que es de tipo numérico
Regresión
Se distingue por la variable objetivo
Se predice un valor real basado en entradas pasadas
Se aplica en
Identificación de dígitos
Regresión lineal
Detección de fraude de identidadic
Diagnósticos
Utilizados
Predecir valores de salida
basados en
características de
entrada y salida de los datos
Algoritmos
Conjunto de entradas recibe los resultados correctos
y aprende comparando su resultado real con resultados
para encontrar errores, modificando el modelo de consecuencia.
Algoritmos
Regresión logística
Se usa para predecir el resultado
de una variable categórica en
función de variables independientes
o predictoras.
Aplicada
Ciencias medicas y sociales
Útil
Unidimensional
Correlaciona la probabilidad
de una variable cualitativa
binaria con una variable escalar x
Debe aproximarse a obtener
un cero en probabilidad o
uno en variable explicativa x
Gráfico
La variable independiente es
la combinación lineal y
la variable dependiente
es la probabilidad estimada.
Árboles de decisión
Útil
Encargado de fabricar diagramas
de construcciones lógicas, similares a
sistemas de predicción basado en reglas
Esqueleto del modelo de predicción,
se representa en modo grafico como un árbol
Elementos
Nodo
Encargado de tomar una
decisión entre varias posibles
Vectores
Son la solución final a la
que llegan las posibilidades
Flechas
Encargada de la unión entre nodos
Etiquetas
Da nombre a cada acción
entre nodo y flecha
Reglas
Nodo inicial no contiene flecha
Los nodos restantes son
apuntados por una
única flecha
Hay un camino único para
llegar del nodo inicial a los demás
K-NN
Conocido
K-nearest neighbors
K vecinos más cercanos
Algoritmo
Entrenamiento
Clasificación
Elección del k
Depende de los datos,
reducen efecto de
ruido en clasificación.
Crean límites
entre clases parecidas
Clasificador bayesiano ingenuo
Clasificador probabilístico
fundamentado con teorema de Bayes
Requiere de una cantidad mínima
de datos de entrenamiento para
estimar parámetros necesarios en la clasificación
SVM
Conocido
Support-vector machine
Máquina de vectores de soporte
Se relacionan con problemas
de clasificación y regresión
Se busca que se
separe de forma óptima
los puntos de una clase de
la otra dentro del hiperplano
SVR Regresión
Se realiza un mapeo de datos de entrenamiento,
a un espacio de mayor dimensión a través
del mapeo no lineal, para realizar una regresión lineal
Machine Learning
Tipos
Aprendizaje Supervisado
Aprendizaje NO Supervisado