MLflow - Tracking

Этот материал теперь в клубе

2 дня интенсива

Научишься использовать простой инструмент для записи и сравнения параметров/результатов ML экспериментов.

Когда у Тебя десятки или даже сотни экспериментов, рано или поздно Ты столкнешься с такими проблемами при обучении ML моделей:

Не сможешь вспомнить - какие именно параметры использовал(а) и какого качества были модели;

Не сможешь воспроизвести свой же лучший результат, т.к. потеряешься среди огромного количества экспериментов;

Фильтровать и находить эксперименты по различным параметрам становится практически невозможно;

MLflow - Tracking решает все эти проблемы!
Пример: "Покажи мне эксперименты, которые дали результат (напр. precision) более 95%" - становится простой задачей :)

Предотвращает хаос в хранении и управлении версиями по мере роста количества ML моделей и экспериментов с ними.


Не нужно запоминать или где-то сбоку "на коленке" записывать, с какими параметрами обучалась модель - эта информация хранится в MLflow.


Не нужно угадывать с какими параметрами и алгоритмами модель дала лучшие результаты - выделяешь все параметры, сравниваешь и получаешь ответ.


Помогает бороться с переобучением ML моделей, предоставляя выбор версии модели.


Предоставляет возможность воспроизводить эксперименты, чтобы потом , например, поделиться своей работой с командой.


MLflow позволяет легко регистрировать, находить и просматривать параметры, метрики и артефакты (файлы) для каждой модели/эксперимента.

Какие проблемы решает MLflow - Tracking:
3 простых шага для участия
Подписка
Вступаешь в DW Club, в котором уже есть много практических материалов.
Email
Получаешь email с данными для авторизации на сервере.
Материалы
Получаешь доступ к практическим материалам. 6 мая добавятся материалы по MLflow.

Интенсив по MLflow - это очередной материал для DW Club

Каждый месяц мы пополняем базу знаний в нашем DW Сlub, тем самым прокачиваем Твои навыки, расширяем горизонты и строим прочный фундамент знаний в области Machine Learning и Data Science.


Что значит

DW Club?

И как получить туда доступ?

Пример использования простого и удобного UI у MLflow:

Преимущества MLflow:
Возможность сохранять (логировать) любые форматы файлов (картинки, csv, html, графики).

Масштабируемость – вся информация сохраняется (записывается), независимо от количества моделей.

Централизованное и безопасное хранилище.

Унификация метрик модели.

Вся информация о метриках модели структурирована.

Простая и понятная документация и API.

На 2-х дневном интенсиве изучим 2 важные концепции:
Run (Запуск) - это единичный прогон эксперимента. Каждый раз, когда запускаешь эксперимент (обучаешь модель), создается новая запись с текущими параметрами модели.


Experiment (Эксперимент) - объединяет несколько запусков в одну группу. Если эксперимент был неудачным, все данные по нему можно будет легко отследить в удобном интерфейсе MLflow.
Владимир Алексейченко
Практический опыт в машинном обучении - 9 лет, в программировании - 14 лет,

Умеет объяснять сложные понятия в математике, статистике, программировании простым языком, с помощью примеров из жизни и функционирования бизнеса,

Более 500 внедренных моделей машинного обучения в производство,

Генеральный директор и основатель DataWorkshop, основатель DataWorkshop
Foundation (европейский фонд в области искусственного интеллекта),

Консультирует крупные европейские компании по внедрению моделей машинного обучения,

Автор 4 курсов: Python для машинного обучения, практическое машинное обучение, NLP, Time Series (более 1000 довольных студентов, которые работают в том числе и в крупных мировых корпорациях и 10 000 участников различных образовательных программ),

Спикер и создатель европейских конференций в области машинного обучения и искусственного интеллекта,

Создатель бесплатных онлайн-тренажеров и интенсивов по машинному обучению: «Корона испытаний», «Матрица», «DWthon» и «DWgym»,

Ведет подкаст Biznes Myśli (> 200 000 прослушиваний).

Креативный подход,
Критическое мышление,
Способность вдохновить учеников и поверить в свои силы,
Способность направить в нужное русло для решения поставленных задач.

Автор и тренер
Создатель авторских курсов по машинному обучению / CEO DataWorkshop
MLflow упрощает жизнь специалистам в сфере Data Science и Machine Learning, т.к. позволяет управлять даже сотнями экспериментов.

Доступ к группе в Slack


Ты получаешь ответы на вопросы по заданиям интенсива

Добавляешь решения и сотни тысячи замотивированных участников делятся своими идеями в ответ (таким образом можешь подсмотреть решения других)

Мы прокачиваем Твои 4 самых главных современных качества - креативность, критическое мышление, кооперация и коммуникация


© All Rights Reserved. DataWorkshop

DataWorkshop sp. z o. o

ul. Mogilska 43

31-545 Kraków

KRS: 0000815135

NIP: 6762574286

REGON: 384914283