DS

Модели

Classical

Desigion tree

Random forest

XGBoost

LightGBM

CatBoost

Цепи Маркова

KNN

Проклятие размерности

SVM

Теорема Мерсера

c1a

Кластеризация

K-means

K-medoids

c1

T-SNE

Выбор количества кластеров

Silhouette

Elbow

Gap statistics

По плотности

DBSCAN

OPTICS

Hierarchical clustering

Multi-armed bandits

Временные ряды

GARCH

ARMA

ARIMA

SARIMA

Фильтр Калмана

c1

Dynamic time warping

Simple Exponential Smoothing

Holt-Winters exponential smoothing

Text

Latent Dirichlet Allocation

c1

Регрессия

Логрегрессия

гетероскедастичность,

Residual Plots

Frisch–Waugh–Lovell theorem

c1

Логистическая регрессия

Сигмоида

Logit-функция

Least Angle Regression

Последовательная ортогонализация (Forward-Stepwise regression)

Метод частичных наименьших квадратов(Partial List-Square)

c1

Anomaly detection

Локальный уровень выброса

c1

Рекомендационные системы

Collaborative filtering

Content based

Manifold Learning

c1a

Fine-tuning

Early stopping

Pruning

Bias-Variance Tradeoff

Регуляризация

c4a

Ridge(L1)

Lasso(L2)

Elastic-Net (a*L1 + (1-a) * L2)

Выбор числа параметров

Akaike information criterion(AIC)

Bayesian information criterion(BIC)

Нейронные сети

Функция активации

c1

ReLU

PReLU

c1

Leaky ReLU

Сигмоида

Softmax

Tahn

Exponential Linear Unit

GeLU

c1

Swish

c1

Механизм

Random Initialization

Gradient Checking

Архитектуры

LSTM

GAN

RNN

Graph Neural Network

Рекомендательные системы

LambdaRank

c1

AdaRank

Слои

Dropout

Convolution

Full-connected

Pulling

GLU (Gated linear unit)

c1

Zero-shot

Ассамбли

Бустинг

Беггинг

Stacking

Типы обучения

Reinforcement learning

Q-Learning

Semi-Supervised Learning

c1

Pipeline

ETL & ELT

c1

OLAP and OLTP

Loss function

Focal Loss

c2

Подготовка данных

Выбросы

Z-score

Isolation Forest

c1

Feature-engineering

Уменьшение размерности

PCA

Elbow method

Kaiser Rule

UMAP

Multidimensional scaling,

c2

Linear discriminant analysis

Несбалансированные выборки

c1

undersampling/oversampling

SMOTE

Tomek Links

Class weights

Condensed Nearest Neighbor Rule

Дубликаты

Feature selection

SHAP

c1

LIME

c4a

Random forest importance measure

Linear Discriminant Analysis

Прямой и обратный выбор подмножества

Missing data

c1

Multiple imputation

c2a

Single imputation

simple mean

last observation carried forward

worst observation carried forward

Encoding

one-hot

Нормализация

стандартизация

weak labelling

c2a

Синтетические/аугментированные данные

Данные

Временные ряды

Преобразование Фурье

Вейвлет-преобразование

Эргодичность

Random walk

Weiner process

Ornstein–Uhlenbeck process

c1

Interest rate models

Cox–Ingersoll–Ross model

c1

Vasicek model

c1

Subtopic

Moving Average process

c1

Invertibility

c1

Авторегрессия

c1

Stationarity

c1

Тест Дики-Фуллера

c1

AR MA duality

Yule Walker Equations

c2

Табличные данные

Текст

Стемминг

Лемматизация

TF-IDF

Эмбеддинг

GLOVE

Word2vec

N-граммы

Bag-of-words

Topic model

Картинки

Edge detection

SIFT

Hough Transform

Звук

Не-ML

ООП

Линейная алгебра

Собственные значения

c1

Операции над матрицами

c1

Линейная незвисимость (коллинеарность)

Сингулярное разложение

Теория информации

Информационная энтропия

Расстояние Кульбака — Лейблера

c1

Теория графов

Орграф

Дерево

Цикл

Матанализ

Интегрирование

Дифференциирование

Частная производная

Седловая точка

Ряд Тейлора

Градиент

Логарифмы

Свёртка

Коэффициент Жаккара

c1

Дифференциальные уравнения

Характеристическое уравнение

c1

Задачи

A/B testing

Рекомендательные системы

Регрессия

Time series prediction

Option price

Black-Scholes Model

Классификация

Sequence Classification

c1

Multiclass Classification

Кластеризация

Тестирование гипотез

c1

Оптимизация

Minimax

Particle swarm optimization

Ant colony optimization

Similarity learning

c1

Survival Analysis

c1

Retention Analysis

c1

AARRR

c1

RARRR

c1

Transfer learning

NLP

Part of Speech Tagging

speech-to-text

Anomaly detection

Поиск каузальности

Average treatment effect

c1

Scoring

Credit scoring

Merton Model

c1

Статистика

Статтесты

Z-тест

c2

T-тест

c1

Two-Sample z-test

c1

p-values

c1a

Пирсона(хи-квадрат)

c1

тест Фишера(F-test)

c1

ANOVA

c1

U-критерий Манна-Уитни

c1

Portmanteau test

c1

Ljung–Box Q test,

c1

Распределения

Нормальное

Логнормальное

Стьюдента

Пуассона

c1

Экспоненциальное

c1

Гамма

c1

Бернулли

Биномиальное

Weibull

c1a

Лапласа

Chi-Square Distribution

c2

F-Distribution

Cross validation

Learning Curve

Поиск минимума функции

Градиентный спуск

Стохастический градиентный спуск

c1

BFGS

Conjugate gradient

Momentum

Backpropagation

Triplet loss

Корреляция

Каузальность

Ковариация

Пирсона

Спирмена (ранговая)

Distance Correlation

c1

Копула

c1

Partial correlation

Основы

Теорема Байеса

Априорное и апостериорное распределение

Метод Монте-Карло

Bootstrap

Distribution shift(Data shift)

c1

Максимальное правдоподобие

Метрики

Classification

ROC AUC

Recall

Presision

F-score

Accuracy

Cross-entropy

Regression

Residual sum of squares

c1

Plots

Q-Q plot

Weibull Plot

c1

Рекомендательные системы

DCG

NDCG

MAP

MRR

Метрики временных рядов

Symmetric Mean Absolute Percentage Error

Geometric Mean Relative Absolute Error

Инструменты

Regexp

SQL

Pandas

Dask

Numpy

Scipy

Matplotlib

Seaborn

Deep

Keras

Tensorflow

PyTorch

PROPHET

GraphML