Мы используем файлы cookie для обеспечения работоспособности сервиса, улучшения навигации и маркетинговых активностей Yolonce. Нажимая "Согласен", вы соглашаетесь с нашей Политикой конфиденциальности

Машинное обучение на практике

  Сложность

Пока неизвестно

  Длительность

24 ак.ч.

  Формат

онлайн

  Документ по выпуску

удостоверение о повышении квалификации государственного образца

Стоимость курса
41 900

Подробнее о курсе

Курс построен вокруг нескольких практических кейсов, содержащих таблицы с исходными данными. По каждому кейсу проходим полный жизненный цикл проекта машинного обучения: исследование, очистка и подготовка данных, выбор метода обучения, соответствующего задаче (линейная регрессия для регрессии, случайный лес для классификации, К-средние и DBSCAN для кластеризации), обучение с использованием выбранного метода, оценка результата, оптимизация модели, представление результата заказчику. На дискуссионной части курса обсуждаем стоящие перед слушателями практические задачи, которые можно решить рассмотренными методами.

Документ после выпуска

удостоверение о повышении квалификации государственного образца

Автор курса

Оценка и обучение ИТ-специалистов по ключевым направлениям разработки программного обеспечения. Курсы от экспертов-практиков по языкам программирования, системному и бизнес-анализу, архитектуре ПО, ручному и автоматизированному тестированию ПО, Big Data и машинному обучению, управлению проектами и Agile. Действует скидка 10% на обучение физических лиц.

Программа курса

  1. Обзор задачи (теория – 1 час)

Какие задачи хорошо решаются машинным обучением, а какие им пытаются решать. Что произойдёт, если вместо Data Scientist взять неспециалиста в данной области (просто разработчика/аналитика/менеджера) с ожиданием, что в процессе научится.

  2. Подготовка, очистка, исследование данных (теория – 1 ч, практика – 1 ч)

Как разобраться в исходных бизнес-данных (и вообще обнаружить в них какой бы то ни было порядок). Последовательность обработки. Что можно и нужно переложить на аналитиков предметной области, а что лучше сделать самому Data Scientist. Приоритеты решения конкретной задачи.

  3. Классификаторы и Регрессоры (теория – 2 ч, практика – 2 ч)

Практический раздел - хорошо формализованные задачи с подготовленными данными. Разница между задачами (бинарная/небинарная/вероятностная классификация, регрессии), перераспределение задач между классами. Примеры классификации практических задач.

  4. Кластеризация (теория – 1 ч, практика – 2 ч)

Где и как проводить кластеризацию: исследование данных, проверка постановки задачи, проверки результатов. Какие случаи можно свести к кластеризации.

  5. Оценка моделей (теория – 1 ч, практика – 1 ч)

Бизнес-метрики и технические метрики. Метрики для задач классификации и регрессии, матрица ошибок. Внутренние и внешние метрики качества кластеризации. Кросс-валидация. Оценка переобучения.

  6. Оптимизация (теория – 5 ч, практика – 3 ч)

Что делает одну модель лучше другой: параметры, признаки, ансамбли. Управление параметрами. Практика выбора признаков. Обзор инструментария для поиска лучших параметров, признаков и методов.

  7. Графики, отчеты, работа с живыми задачами (теория – 2 ч, практика – 2 ч)

Как доступно объяснить происходящее: себе, команде, клиенту. Более красивые ответы на бессмысленные вопросы. Как презентовать три терабайта результатов на одном слайде. Полуавтоматические тесты, какие точки контроля процесса действительно нужны. От живых задач к полному R&D процессу («НИОКР на практике») – разбор и анализ задач от аудитории.

Оставьте отзыв

Напишите ваш коментарий, не менее 30 символов

Нажимая кнопку, вы даете согласие на обработку персональных данных

обновлено: 19.09.2024

Оставьте заявку

Наши консультанты ответят на все вопросы
И помогут в выборе

Комментарий ...

Нажимая кнопку, вы даете согласие на обработку персональных данных