ML и Визуализация данных
Анализ данных, работа с Google Colab, Python и современными DS-библиотеками.
Теория (Лекции)
15- 1.Python для инженера данных и Основы NumPy
- 2.Pandas Core — Фундамент работы с таблицами
- 3.Pandas Advanced: Агрегация, Сводные таблицы и Джойны
- 4.Основы визуализации с Matplotlib. Анатомия графика
- 5.Многомерный анализ и Seaborn
- 6.Продвинутый EDA, Очистка и Feature Engineering
- 7.Введение в ML: KNN и Метрики классификации
- 8.Линейная Регрессия. Интерпретируемость и Метрики
- 9.Логистическая регрессия. Регуляризация и ROC-AUC
- 10.Деревья решений (Decision Trees). Математика выбора
- 11.Ансамбли I. Random Forest и Bagging
- 12.Ансамбли II. Градиентный Бустинг (Gradient Boosting)
- 13.Кластеризация: K-Means и Иерархический анализ
- 14.Снижение размерности. PCA, t-SNE и Проклятие размерности
- 15.Валидация, Тюнинг и Пайплайны (Pipelines)
Практика (Лабораторные)
15- 1.Лабораторная работа №1: Python Refresher и Векторизация с NumPy
- 2.Лабораторная работа №2: Основы Pandas
- 3.Лабораторная работа №3: Продвинутый Pandas (EDA)
- 4.Лабораторная работа №4: Основы визуализации с Matplotlib
- 5.Лабораторная работа №5: Многомерный анализ с Seaborn
- 6.Лабораторная работа №6: Комплексный EDA и Feature Engineering
- 7.Введение в ML: Классификация с KNN
- 8.Введение в ML: Линейная Регрессия
- 9.Введение в ML: Логистическая регрессия и ROC-AUC
- 10.Введение в ML: Деревья Решений (Decision Trees)
- 11.Введение в ML: Ансамбли. Random Forest
- 12.Введение в ML: Градиентный Бустинг (XGBoost & CatBoost)
- 13.Введение в ML: Кластеризация и Сегментация клиентов
- 14.Введение в ML: Снижение размерности (PCA и t-SNE)
- 15.Введение в ML: Пайплайны, Кросс-валидация и GridSearch