Pазработчик BigData (2018)
В результате прохождения курса слушатель сможет самостоятельно реализовывать весь процесс от поиска знаний в данных до построения процесса по обработке данных в боевом окружении, будет обладать знаниями, необходимыми для изучения более сложных методов машинного обучения.
Содержание:
- Базовые инструменты анализа данных в Python
- Вводная в математические операции
- Визуализация
- Линейная регрессия
- Логистическая регрессия
- KNN, наивный байес
- kMeans, EM
- Иерархическая кластеризация, DB-Scan
- Feature engineering
- Поиск выбросов в данных
- Уменьшение размерности
- Методы оптимизации
- Деревья решений
- Ансамбли моделей
- Бустинг
- SVM, Support vector machine
- Анализ текстовых данных
- Анализ текстовых данных 2
- Рекомендательные системы
- Временные ряды
- Latent Dirichlet Allocation
- Нейронные сети, часть 1
- Нейронные сети, часть 2
- Алгоритмы на графах
- Процесс CRISP-DM. Выбор хранилища, запросы к базе (Реляционная, нереляционная). Большие данные и параллельные вычисления
- Vowpal Wabbit для обучения линейных моделей на одной машине
- MapReduce на Java, Hadoop Streaming — MapReduce на Python, bash
- Пайплайны. Способы выстроить поток задач, обеспечить выполнение. Отказоустойчивость, мониторинг
- Слои данных для оптимизации процессов использования данных. Hive
- Организация хранения данных для решения задач машинного обучения
- Spark
- Обзор решений для аналитики больших данных
Автор: Коллектив
Язык:русский
Формат: MP4 (+ доп. файлы)
Видео: AVC, 1280x720, ~154 Kbps
Аудио: AAC, 126 Kbps, 48.0 KHz
Скачать обучающее видео "Pазработчик BigData" (14,28 ГБ):
tottall 20/10/18 Просмотров: 1398
0