Когда у Тебя десятки или даже сотни экспериментов, рано или поздно Ты столкнешься с такими проблемами при обучении ML моделей:
Не сможешь вспомнить - какие именно параметры использовал(а) и какого качества были модели;
Не сможешь воспроизвести свой же лучший результат, т.к. потеряешься среди огромного количества экспериментов;
Фильтровать и находить эксперименты по различным параметрам становится практически невозможно;
MLflow - Tracking решает все эти проблемы! Пример: "Покажи мне эксперименты, которые дали результат (напр. precision) более 95%" - становится простой задачей :)
Предотвращает хаос в хранении и управленииверсиями по мере роста количества ML моделей и экспериментов с ними.
Не нужно запоминать или где-то сбоку "на коленке" записывать, с какими параметрами обучалась модель - эта информация хранится в MLflow.
Не нужно угадывать с какими параметрами и алгоритмами модель дала лучшие результаты - выделяешь все параметры, сравниваешь и получаешь ответ.
Помогает бороться с переобучением ML моделей, предоставляя выбор версии модели.
Предоставляет возможность воспроизводить эксперименты, чтобы потом , например, поделиться своей работой с командой.
MLflow позволяет легко регистрировать, находить и просматриватьпараметры, метрики и артефакты (файлы) для каждой модели/эксперимента.
Вступаешь в DW Club, в котором уже есть много практических материалов.
Email
Получаешь email с данными для авторизации на сервере.
Материалы
Получаешь доступ к практическим материалам. 6 мая добавятся материалы по MLflow.
Интенсив по MLflow - это очередной материал для DW Club
Каждый месяц мы пополняем базу знаний в нашем DW Сlub, тем самым прокачиваем Твои навыки, расширяем горизонты и строим прочный фундамент знаний в области Machine Learning и Data Science.
Возможность сохранять (логировать) любые форматы файлов (картинки, csv, html, графики).
Масштабируемость – вся информация сохраняется (записывается), независимо от количества моделей.
Централизованное и безопасное хранилище.
Унификация метрик модели.
Вся информация о метриках модели структурирована.
Простая и понятная документация и API.
На 2-х дневном интенсиве изучим 2 важные концепции:
Run (Запуск) - это единичный прогон эксперимента. Каждый раз, когда запускаешь эксперимент (обучаешь модель), создается новая запись с текущими параметрами модели.
Experiment (Эксперимент) - объединяет несколько запусков в одну группу. Если эксперимент был неудачным, все данные по нему можно будет легко отследить в удобном интерфейсе MLflow.
Владимир Алексейченко
Практический опыт в машинном обучении - 9 лет, в программировании - 14 лет,
Умеет объяснять сложные понятия в математике, статистике, программировании простым языком, с помощью примеров из жизни и функционирования бизнеса,
Более 500 внедренных моделей машинного обучения в производство,
Генеральный директор и основатель DataWorkshop, основатель DataWorkshop Foundation (европейский фонд в области искусственного интеллекта),
Консультирует крупные европейские компании по внедрению моделей машинного обучения,
Автор 4 курсов: Python для машинного обучения, практическое машинное обучение, NLP, Time Series (более 1000 довольных студентов, которые работают в том числе и в крупных мировых корпорациях и 10 000 участников различных образовательных программ),
Спикер и создатель европейских конференций в области машинного обучения и искусственного интеллекта,
Создатель бесплатных онлайн-тренажеров и интенсивов по машинному обучению: «Корона испытаний», «Матрица», «DWthon» и «DWgym»,
Ведет подкаст Biznes Myśli (> 200 000 прослушиваний).
Креативный подход, Критическое мышление, Способность вдохновить учеников и поверить в свои силы, Способность направить в нужное русло для решения поставленных задач.
Автор и тренер
Создатель авторских курсов по машинному обучению / CEO DataWorkshop
MLflow упрощает жизнь специалистам в сфере Data Science и Machine Learning, т.к. позволяет управлять даже сотнями экспериментов.
Доступ к группе в Slack
Ты получаешь ответы на вопросы по заданиям интенсива
Добавляешь решения и сотни тысячи замотивированных участников делятся своими идеями в ответ (таким образом можешь подсмотреть решения других)
Мы прокачиваем Твои 4 самых главных современных качества - креативность, критическое мышление, кооперация и коммуникация