Categorías: Todo - datos - modelado - sector - despliegue

por Jonny Carlos Sanchez hace 3 meses

58

Ciencias de Datos

El texto trata sobre los diferentes aspectos y técnicas relacionados con la ciencia de datos, abarcando desde el modelado y tipos de modelos hasta el aprendizaje supervisado y no supervisado.

Ciencias de Datos

Jonny Carlos Sánchez González

Ciencias de Datos

Evaluación

Análisis del error
Precision-Recall
Curvas ROC
Matriz de Confusión
Bootstrapping
K-Fold Cross-Validation
Métricas de rendimiento
AUC-ROC
F1-Score
MSE, MAE para regresión
Precisión

Despliegue

Publicación científica
API
Servicio web
Página web

Comprensión del negocio

Recursos disponibles
Tecnológicos
Técnicos
Humanos
Stakeholders
Grupos de interés
Sector
Ingeniería
Economía
Salud
Gobierno
Plan de proyecto
Resultados esperados
Hipótesis
Metas
Alcance
Objetivos

Modelado

Retos
Subajuste (Underfitting)
Sobreajuste (Overfitting)
Entrenamiento del modelo
Ajuste de hiperparámetros
Validación cruzada
Datos

Prueba

Validación

Entrenamiento

Tipos de modelos
Aprendizaje profundo

Transformadores

Redes Neuronales Recurrentes

Redes Neuronales Convolucionales

Aprendizaje por refuerzo
Aprendizaje no supervisado

DBSCAN

K-Means

Aprendizaje supervisado

Árboles de decisión

Regresión lineal y logística

Preparación de datos

Herramientas
SQL
Python
R
Transformación de datos
Estandarización
Normalización
Limpieza de datos
Corrección de errores
Imputación de datos
Manejo de valores nulos
Eliminación de registros duplicados

Compresión de datos

Visualización
Boxplots
Gráficos de barras
Histogramas
Diagramas de dispersión
Análisis estadísticos
Valores atípicos
Análisis de correlación
Estadística descriptiva
Tipo de datos
No estructurados

Archivos

Imágenes

Texto

Semiestructurados

XML

Json

Estructurados

Base de datos

Fuentes de datos
Web scraping
APIs
Datos abiertos
Sector Privado
Sector Gubernamental