BI Consult
  • Перейти на КликСенс
  • Перейти на КликВью
  • Перейти на Tableau
  • Перейти на Power BI
  • российские bi dwh dl
  • Главная
  • Продукты Business-BI
    • Дистрибуция
    • Розничная торговля
    • Производство
    • Операторы связи
    • Страхование
    • Банки
    • Лизинг
    • Логистика
    • Нефтегазовый сектор
    • Медицина
    • Сеть ресторанов
    • Энергетика
    • Фрод-менеджмент
    • E-Commerce
    • Фармацевтика
    • Построение хранилища данных
    • Создание Data Lake
    • Цифровая трансформация
    • Управление по KPI
    • Финансы
    • Продажи
    • Склад
    • HR
    • Маркетинг
    • Внутренний аудит
    • Категорийный менеджмент
    • S&OP и прогнозная аналитика
    • Геоаналитика
    • Цепочки поставок (SCM)
    • Process Mining
    • Сквозная аналитика
  • Платформы
    • Qlik Sense
    • QlikView
    • Tableau
    • Microsoft Power BI
    • Геоаналитика Qlik GeoAnalytics
    • Qlik NPrinting - рассылка отчетности QlikView/Qlik Sense
    • KliqPlanning Suite - бюджетирование в QlikView
    • ATK BiView-1C Коннектор (для Qlik/Tableau/PowerBI)
    • QlikView/Qlik Sense SAP Коннектор
    • QlikView R-Коннектор
    • Qlik Web Connectors - коннектор Google, Facebook, Twitter
    • Vizlib Qlik Sense extentions (библиотека экстеншнов)
    • Библиотека extention для Qlik
    • Qlik Alerting
    • Qlik Data Integration Platform - создание Data Lake
    • Qlik Data Catalog решение для Data Governance
    • ATK BiView документация
  • Услуги
    • Консалтинг
    • Пилотный проект
    • План обучения и сертификации
    • Подготовка специалистов по Qlik
    • Бесплатное обучение Qlik
    • Сертификация Qlik
    • Поддержка
    • Технические задания
    • Сбор требований для проекта внедрения BI-системы
    • Аудит приложений Qlik и Tableau
    • Разработка BI Стратегии
    • Styleguide для BI-системы
    • Как выбрать BI-систему
  • Курсы
    • Учебный курс по Qlik Sense
    • Учебный курс по Tableau
    • Учебный курс по Microsoft Power BI
    • Учебный курс Информационная грамотность (Data Literacy)
    • Учебный курс Современная архитектура хранилища данных
    • Учебный курс для бизнес-аналитиков
    • Учебный курс по NPrinting
    • Учебный курс по BigQuery
    • Учебный курс по Azure Databricks
    • Учебный курс по DWH
    • Учебный курс по Data Governance
    • Учебный курс по Data Science (ML, AI)
    • Учебный курс администратора Qlik Sense
  • Компания
    • Руководство
    • Новости
    • Клиенты
    • Карьера
    • Скачать
    • Контакты

Услуги

  • Консалтинг
    • Продуктивный и согласованный анализ закупок, продаж и маркетинговых активностей в Fashion-Retail
    • Тренинг «S&OP для производственно-торговых компаний»
    • Проект внедрения Qlik
  • План обучения и сертификации
    • Учебные курсы Qlik
    • Учебные курсы Tableau
    • Учебные курсы Microsoft PowerBI
  • Бесплатное обучение
  • Сертификация Qlik
  • Пилотный проект
  • Сопровождение и поддержка
  • Технические задания
  • Сбор требований для проекта внедрения BI-системы
  • Аудит приложений QlikView / Qlik Sense / Tableau
  • Разработка BI Стратегии
    • Становясь Data-Driven организацией: скрытые возможности и проблемы
  • Styleguide для BI-системы
  • Как выбрать подходящую современную BI-систему

Отраслевые решения

  • Дистрибуция
    • Business-BI Дистрибуция
  • Розничная торговля
    • Business-BI Розничная торговля
    • Business-BI Розничная торговля: DIY
    • Business-BI Розничная торговля: Fashion
    • Business-BI для сетей аптек
    • BusinessPack для Tableau: POS - Point of Sales Perfomance
  • Производство
    • Business-BI Производство
  • Операторы связи
  • Банки
    • Business-BI for Banking
    • Бизнес-аналитика в банке
  • Страхование
  • Фармацевтика
    • Business-BI Фармацевтика
  • Нефтегазовый сектор
  • Лизинг
  • Логистика
  • Медицина
  • Сеть ресторанов
  • Энергетика
  • E-Commerce
  • Анализ мошенничеств (фрод-менеджмент)

Функциональные решения

  • Управление по KPI
    • Самоуправляемая компания
  • Финансы
    • Бюджетирование
    • Консолидация финансовой отчетности
    • Панель управления, KPI для CFO
    • Рабочий капитал
    • Финансовая отчетность по МСФО
    • Платежный календарь / прогнозный ДДС
  • Продажи
    • Анализ данных из CRM
    • Планирование
  • Склад
  • Категорийный менеджмент
  • HR
  • Маркетинг
  • Внутренний аудит
  • Построение хранилища данных
  • Геоаналитика, аналитика на географической карте
  • Цепочка поставок (SCM)
  • S&OP и прогнозная аналитика
    • Прогнозная аналитика
    • Прогноз спроса на основании данных о вторичных продажах
  • Разработка стратегии цифровой трансформации
  • Сквозная аналитика
  • Process Mining
Главная » Курсы » Учебный курс Современная архитектура хранилища данных

Что такое MLOps? Объяснение операций машинного обучения

В этой статье мы расскажем вам об операциях машинного обучения, которые похожи на DevOps для машинного обучения.

До недавнего времени все мы изучали стандартный жизненный цикл разработки программного обеспечения (SDLC). Он начинается от постановки требований, затем идет проектирование и разработка, тестирование и развертывание, и затем дальнейшее обслуживания.

Мы изучали (и до сих пор изучаем) модель «водопад», итеративную модель и гибкие модели разработки программного обеспечения.

Сейчас мы находимся на стадии, когда почти каждая компания пытается включить в свой продукт машинное обучение (ML), часто называемое искусственным интеллектом.

Это новое требование построения систем машинного обучения дополняет и реформирует некоторые принципы SDLC, давая жизнь новой инженерной дисциплине, называемой операциями машинного обучения или MLOps. И этот новый термин вызвал настоящий ажиотаж и привел к появлению новых должностей.

Здесь мы поговорим о следующем:

  • Что такое MLOps?
  • Какие проблемы решает MLOps?
  • Какие навыки вам нужны для MLOps?

Продолжайте читать, и мы подробно объясним каждый пункт.

 

Что такое MLOps?

Если вы посмотрите на MLOps в Google-трендах, то увидите, что это относительно новая дисциплина. Опять же, это произошло потому, что все больше организаций пытаются интегрировать системы машинного обучения в свои продукты и платформы.

 

Вот как я бы определил MLOps:

MLOps – это инженерная дисциплина, которая направлена на объединение разработки систем машинного обучения (dev) и развертывания систем машинного обучения (ops) для стандартизации и оптимизации непрерывной поставки высокопроизводительных моделей в производство.

 

Почему MLOps?

До недавнего времени мы имели дело с управляемыми объемами данных и очень небольшим количеством моделей в небольшом масштабе.

Сейчас ситуация меняется, и мы встраиваем автоматизацию принятия решений в широкий спектр приложений. Это порождает множество технических проблем, возникающих при создании и развертывании систем на основе машинного обучения.

Чтобы понять MLOps, мы должны сначала понять жизненный цикл систем ML. В жизненном цикле задействованы несколько разных команд организации, основанной на данных.

С самого начала и до конца участвуют следующие команды:

  • Группа по развитию бизнеса или продукта – определение бизнес-целей с помощью KPI.
  • Инженерия данных – сбор и подготовка данных.
  • Наука о данных – проектирование решений машинного обучения и разработка моделей.
  • ИТ или DevOps – полная настройка развертывания, мониторинг вместе с учеными.

Вот очень упрощенное представление жизненного цикла машинного обучения.

 

Команды Google проводят множество исследований технических проблем, возникающих при создании систем на основе машинного обучения. Статья NeurIPS о скрытом техническом долге в системах машинного обучения показывает, что разработка моделей – это лишь очень небольшая часть всего процесса. Есть много других процессов, конфигураций и инструментов, которые необходимо интегрировать в систему.

 

 

Чтобы оптимизировать всю эту систему, у нас есть новая культура машинного обучения. В системе задействованы все: от высшего руководства с минимальными техническими навыками до специалистов по данным, DevOps и инженеров машинного обучения.

 

Какие проблемы решает MLOps?

Управление такими системами в масштабе – непростая задача, и для этого необходимо устранить множество узких мест. Ниже перечислены основные проблемы, с которыми сталкиваются команды:

  • Ощущается нехватка специалистов по данным, которые хорошо разбираются в разработке и развертывании масштабируемых веб-приложений. В наши дни на рынке появились инженеры нового профиля – машинного обучения, призванные удовлетворить эту потребность. Это золотая середина на пересечении Науки о данных и DevOps.
  • Изменение бизнес-целей в модели. Есть множество зависимостей, связанных с непрерывным изменением данных, поддержанием стандартов производительности модели и обеспечением управления ИИ. Трудно идти в ногу с непрерывным обучением модели и меняющимися бизнес-целями.
  • Пробелы в коммуникации между техническими и бизнес-командами, из-за которых трудно найти общий язык для совместной работы. Чаще всего именно этот разрыв становится причиной провала крупных проектов.
  • Оценка рисков – ведется много споров о том, что такие системы МО/ГО являются черными ящиками. Часто модели имеют тенденцию отклоняться от того, для чего они были изначально были предназначены. Оценка риска/стоимости таких сбоев – очень важный и ответственный шаг.

Например, стоимость неточной рекомендации по видео на YouTube будет намного ниже по сравнению с пометкой невиновного человека за мошенничество и блокировкой его учетной записи, а также с отклонением заявок на получение кредита.

 

Какие навыки вам нужны для MLOps?

К этому моменту я уже подробно рассказал об узких местах системы и о том, как MLOps решает каждое из них. Вы можете открыть для себя навыки, на которые нужно ориентироваться в этих испытаниях.

Ниже представлены ключевые навыки, на которых вам нужно сосредоточиться:

 

1. Фрейминг проблем машинного обучения с учетом бизнес-целей

Разработка систем машинного обучения обычно начинается с бизнес-цели или задачи. Это может быть простая цель – снизить процент мошеннических транзакций ниже 0,5%, или создать систему для обнаружения рака кожи на изображениях, помеченных дерматологами.

Эти цели часто имеют определенные показатели производительности, технические требования, бюджеты проекта и KPI (ключевые показатели эффективности), которые управляют процессом мониторинга развернутых моделей.

 

2. Создание архитектуры машинного обучения и решения проблемы с данными.

После того, как цели четко переведены в задачи машинного обучения, следующим шагом будет поиск подходящих входных данных и типов моделей, которые можно попробовать для таких данных.

Поиск данных – одна из самых сложных задач. Это процесс состоит из нескольких частей:

  • Вам нужно искать любой доступный соответствующий набор данных,
  • Необходимо проверить достоверность данных и их источник.
  • Проверить, соответствует ли источник данных таким нормам, как GDPR (Общие положения о защите данных)?
  • Как сделать набор данных доступным?
  • Какой тип источника – статический (файлы) или потоковый в реальном времени (датчики)?
  • Сколько источников нужно использовать?
  • Как построить конвейер данных, который может управлять как обучением, так и оптимизацией после развертывания модели в производственной среде?
  • Какие облачные сервисы вы будете использовать?

 

3. Подготовка и обработка данных – часть инженерии данных.

Подготовка данных включает в себя такие задачи, как проектирование функций, очистка (форматирование, проверка выбросов, повторная балансировка и т. д.), а затем выбор набора функций, которые способствуют выходу основной проблемы.

Вам необходимо спроектировать полный конвейер, а затем закодировать его для получения чистых и совместимых данных, которые будут переданы на следующий этап разработки модели.

Важной частью развертывания таких конвейеров является выбор правильной комбинации облачных сервисов и архитектуры, которая является производительной и рентабельной. Например, если вам нужно много перемещать и хранить огромные объемы данных, вы можете создать озера данных с помощью AWS S3 и AWS Glue.

Возможно, вы захотите попрактиковаться в создании нескольких различных типов конвейеров (пакетная или потоковая передача) и попытаться развернуть эти конвейеры в облаке.

 

4. Обучение модели и эксперименты с ней – наука о данных

Как только ваши данные будут подготовлены, вы перейдете к следующему этапу обучения своей модели машинного обучения.

Теперь начальный этап обучения является итеративным с использованием множества различных типов моделей. Вы сузите круг до наилучшего решения, используя несколько количественных показателей, таких как точность, отзыв и многое другое.

Вы также можете использовать качественный анализ модели, который учитывает математику, лежащую в основе этой модели, или, проще говоря, объяснимость модели.

У нас есть полный список задач, по обучению моделей машинного обучения:

 

Шпаргалка для почти любого проекта машинного обучения

Работая над созданием ряда достойных портфолио проектов для всех вас, я подумал о том, чтобы задокументировать практики, которым я научился у других, или которые разработал сам во время своей работы. В этом блоге…

Теперь вы будете проводить множество экспериментов с разными типами данных и параметров. Еще одна проблема, с которой специалисты по обработке данных сталкиваются при обучении моделей – это воспроизводимось. Ее можно решить путем создания версий ваших моделей и данных.

Вы можете добавить контроль версий ко всем компонентам ваших систем машинного обучения (в основном к данным и моделям) вместе с параметрами.

Теперь сделать это очень легко с помощью инструментов с открытым исходным кодом, таких как DVC и CML .

Есть еще задачи:

  • Тестирование модели путем написания модульных тестов для обучения.
  • Проверка модели по базовым линиям, более простым моделям и по разным размерам.
  • Масштабирование обучения модели с использованием распределенных систем, аппаратных ускорителей и масштабируемого анализа.

 

5. Построение и автоматизация конвейеров машинного обучения.

Вы должны строить свои конвейеры машинного обучения, имея в виду следующие задачи:

  • Определить системные требования – параметры, вычислительные потребности, триггеры.
  • Выбрать подходящую облачную архитектуру – гибридную или мультиоблачную.
  • Построить конвейеры обучения и тестирования.
  • Отслеживать и проверять работу «трубопроводов данных».
  • Выполнять проверку данных.

 

6. Развертывание моделей в производственной системе.

В основном есть два способа развертывания модели машинного обучения:

  • Статическое развертывание или встроенная модель – модель упаковывается в устанавливаемое прикладное программное обеспечение, а затем развертывается. Например, приложение, предлагающее пакетную оценку запросов.
  • Динамическое развертывание – когда модель развертывается с использованием веб-инфраструктуры, такой как FastAPI или Flask, и предлагается в качестве конечной точки API, которая отвечает на запросы пользователей.

В рамках динамического развертывания вы можете использовать разные методы:

  • развертывание на сервере (виртуальной машине)
  • развертывание в контейнере
  • безсерверное развертывание
  • потоковая передача моделей – вместо REST API все модели и код приложения регистрируются в движке потоковой обработки, таком как Apache Spark, Apache Storm и Apache Flink.

Ниже приведены некоторые соображения по этому поводу:

  • Обеспечение надлежащей документации и результатов тестирования.
  • Повторная проверка точности модели.
  • Проведение проверок объяснимости.
  • Обеспечение выполнения всех требований к корпоративному управлению.
  • Проверка качества любых артефактов данных
  • Нагрузочное тестирование – использование вычислительных ресурсов.

 

7. Мониторинг, оптимизация и обслуживание моделей.

Вам нужно не только следить за эффективностью работы моделей в производстве, но необходимо также обеспечивать хорошее и справедливое управление.

Управление здесь означает добавление мер контроля, чтобы обеспечить выполнение моделями своих обязанностей перед всеми заинтересованными сторонами, сотрудниками и пользователями, которых они затрагивают.

В рамках этого этапа нам нужны специалисты по данным и инженеры DevOps, чтобы поддерживать всю систему в рабочем состоянии, выполняя следующие задачи:

  • Отслеживание снижения производительности и бизнес-качества прогнозов модели.
  • Настройка стратегий ведения журналов и установление показателей непрерывной оценки.
  • Устранение сбоев системы и системных ошибок.
  • Настройка производительности модели как в обучающих, так и в обслуживающих конвейерах, развернутых в производственной среде.

 

Кроме того, мы предлагаем вам почитать следующее:

Эта статья посвящена MLOps, и представляет собой не профиль специальности, а экосистему из нескольких заинтересованных сторон.

Если вы работаете на стыке машинного обучения и разработки программного обеспечения (DevOps), то вы хорошо подходите для стартапов и средних организаций, которые ищут людей, которые могут управлять такими системами от начала до конца.

Инженер ML – это позиция, которая обслуживает такую вот золотую середину, и это то, на что должны ориентироваться начинающие кандидаты. Ниже представлены несколько ресурсов, которые вы можете просмотреть:

  • [Книга]: книга Андрея Буркова по Инженерия машинного обучения.
  • [Книга]: Введение в MLOps от O’Reilly media.

 

 

 

Узнать стоимость решенияЗапросить видео презентацию

Запросить видео презентацию Запросить доступ к демо стенду online

Задать вопрос

loading...

Решения

Анализировать ФинансыУвеличивайте ПродажиОптимальный Склад и ЛогистикаМаркетинговые Метрики

До 2023 года компания BI Consult обладала официальным партнерским статусом Qlik в России. В настоящий момент деятельность QlikTech на территории России прекращена, BI Consult не имеет партнерских отношений и никаким иным образом более не связана с QlikTech и не предлагает к продаже системы бизнес-анализа QlikView, Qlik Sense и иные продукты бренда Qlik. Все материалы о продукции бренда Qlik на сайте приведены исключительно в описательных целях и для информирования пользователей о существующих в мире системах бизнес-анализа. Для приобретения продукции Qlik необходимо обратиться к правообладателю программного обеспечения QlikTech или дистрибьюторам.

Клиенты

  • Arla Foods

    Анализ комплекса показателей продаж во всех разрезах (в т.ч. по каналам, по регионам, по категориям товаров, с детализацией до SKU, до клиента, до менеджера, до даты)

    Реализация отчетов: Sales Contribution Report; Отчет по отгрузкам после пересчета  (в т.ч. анализ возвратов, бонусов, себестоимости, прибыли, рентабельности и т.д.)

    Анализ листинга

    Планирование акций и расчет скидок по акциям

    План-фактный анализ продаж (до год/мес/SKU)

    План-фактный анализ заказа на день (по территориальным представителям)

    ABC-XYZ-анализ (по ассортиментному справочнику до SKU, по клиентам)

    Сравнительный анализ продаж по периодам (в т.ч. like for like, YTD)

    Анализ эффективности работы региональных представителей

    Конструктор отчетов

  • Swedwood

    Анализ существующей архитектуры QlikView и статистики использования; Разработка рекомендаций по оптимизации структуры документов и модели данных QlikView; Установка инструмента анализа статистики использования отчетов на основе данных логов

  • ПетроИнТрейд
    Анализ и управление продажами.

    Прогнозирование производства в QlikView, прогнозирование производства продукции в QlikView, прогнозирование объема производства в QlikView, прогнозирование издержек производства в QlikView.

    Сравнительный анализ выбранных периодов по ключевым показателям, в том числе like-for-like анализ (LFL)
    Конструктор отчетов (табличный и графический);
    ABC-XYZ анализ товаров, категорий, брендов, магазинов, поставщиков  в различных разрезах; анализ стабильности ассортимента;
    Анализ развития направлений: анализ внедрений, анализ активности руководителей направления по развитию, анализ первых продаж продукта клиентам
    Панель управления по продажам (dashboard);
  • Полноценное решение для оценки работы ресторанов в сети.  Решение состоит из трех основных блоков QlikView:
    • KPI деятельности ресторанов, LFL-анализ ресторанов, отчетность для совета директоров; 
    • Операционная аналитика, план/фактный анализ YTD, MTD / Forecast, DTD; 
    • Маркетинговая и продуктовая аналитика.
    А также включает дополнительное приложение NPrinting для ежедневной рассылки корпоративной отчетности по всем ресторанам, управляющим и директорам этих ресторанов.
    Приложение консолидирует данные из различных источников.
  • Решения
    • Дистрибуция
    • Розничная торговля
    • Производство
    • Операторы связи
    • Банки
    • Страхование
    • Фармацевтика
    • Лизинг
    • Логистика
    • Медицина
    • Нефтегазовый сектор
    • Сеть ресторанов
  • BI платформы
    • Qlik Sense
    • QlikView
    • Tableau
    • Microsoft Power BI
    • ATK BiView-1C Коннектор (для Qlik/Tableau/PowerBI)
    • Vizlib Qlik Sense extentions (библиотека экстеншнов)
    • NPrinting
    • Геоаналитика Qlik GeoAnalytics
    • KliqPlanning Suite
    • Qlik WebConnectors
    • QlikView R Коннектор
    • QlikView/Qlik Sense SAP Коннектор
    • Alteryx
    • Qlik Data Catalog
    • Документация ATK BiView
  • Услуги
    • Консалтинг
    • Пилотный проект
    • Поддержка
    • План обучения и сертификации Qlik
    • Бесплатное обучение
    • Учебные курсы
    • Сертификация Qlik
    • Аудит приложений
  • Курсы
    • Учебный курс по Qlik Sense
    • Учебный курс по Tableau
    • Учебный курс по Microsoft Power BI
    • Учебный курс Современная архитектура хранилища данных
    • Учебный курс Информационная грамотность
    • Учебный курс для бизнес-аналитиков
    • Учебный курс по NPrinting
    • Учебный курс по Azure Databricks
    • Учебный курс по Google BigQuery
  • Компания
    • О нас
    • Руководство
    • Новости
    • Клиенты
    • Скачать
    • Контакты
  • Функциональные решения
    • Продажи
    • Финансы
    • Склад
    • HR
    • S&OP и прогнозная аналитика
    • Внутренний аудит
    • Геоаналитика
    • Категорийный менеджмент
    • Построение хранилища данных
    • Система управления KPI и BSC
    • Управление цепочками поставок
    • Маркетинг
    • Цифровая трансформация
    • Сквозная аналитика
    • Process Mining
LinkedInYouTubeVkontakteFacebook
ООО "Би Ай Консалт",
ИНН: 7811437757,
ОГРН: 1097847154184
199178, Россия,
Санкт-Петербург,
6-ая линия В.О., Д. 63, 4 этаж
Тел: +7 (812) 334-08-01
Тел: +7 (499) 608-13-06
E-mail: info@biconsult.ru