Системи машинного навчання, які працюють у реальних умовах: статичне й динамічне навчання

Загалом модель можна навчати одним із двох способів.

  • Статичне навчання (інша назва – навчання офлайн) означає, що модель тренується лише один раз. Потім деякий час використовується та сама навчена модель.
  • Динамічне навчання (інша назва – навчання онлайн) означає, що модель тренується постійно або принаймні часто. Зазвичай використовується остання навчена версія моделі.
Рисунок 2. Із сирого тіста виходять три однакові буханки хліба.
Рисунок 2. Статичне навчання. Одноразове навчання; багаторазове використання тієї самої моделі. (Зображення від Pexels і fancycrave1.)

 

Рисунок 3. Із сирого тіста щоразу виходять дещо інші буханки хліба.
Рисунок 3. Динамічне навчання. Часте повторне навчання; використання найновішої моделі. (Зображення від Pexels і Couleur.)

 

Таблиця 1. Основні переваги й недоліки.

Статичне навчання Динамічне навчання
Переваги Простіше. Розробити й протестувати модель потрібно лише один раз. Адаптивніше. Модель не відставатиме від будь-яких змін у зв’язку між ознаками й мітками.
Недоліки Модель може бути застарілою. Якщо зв’язок між ознаками й мітками із часом зміниться, прогнози моделі погіршаться. Потрібно більше працювати. Потрібно весь час створювати, тестувати й випускати новий продукт.

Якщо набір даних насправді не змінюється із часом, виберіть статичне навчання, а не динамічне, оскільки таку систему дешевше створити й обслуговувати. Однак набори даних мають тенденцію змінюватися із часом, навіть якщо їх ознаки здаються такими ж постійними, як, скажімо, рівень моря. Висновок: слід відстежувати зміни вхідних даних навіть у разі статичного навчання.

Наприклад, розгляньмо модель, навчену прогнозувати ймовірність того, що користувачі купуватимуть квіти. Через нестачу часу модель навчалася лише один раз на наборі даних про купівлю квітів за липень і серпень. Модель працює нормально протягом кількох місяців, але напередодні Дня святого Валентина робить дуже погані прогнози, оскільки поведінка користувачів перед цим квітковим святом різко змінюється.

Щоб дізнатися більше про поняття статичного й динамічного навчання, перегляньте курс Керування проектами машинного навчання.

Вправи. Перевірте свої знання

Які два з наведених нижче тверджень щодо статичного (офлайн-) навчання правильні?
Модель оновлюється, коли надходять нові дані.
Насправді, якщо навчання відбувається в режимі офлайн, модель не зможе приймати нові дані, щойно вони надходять. Через це модель може застаріти, якщо розподіл, на основі якого вона навчається, змінюється із часом.
Модель можна перевірити, перш ніж застосовувати її в реальних умовах.
Так, навчання в режимі офлайн дає змогу добре перевірити ефективність моделі, перш ніж розгортати її для роботи в реальних умовах.
Офлайн-навчання вимагає менше контролю за тренувальними завданнями, ніж онлайн-навчання.
Загалом вимоги до моніторингу під час навчання скромніші, якщо воно проводиться в режимі офлайн, тобто не потрібно дотримуватися багатьох рекомендацій для навчання в робочих умовах. Однак що частіше ви навчаєте свою модель, то більше вам потрібно буде інвестувати в моніторинг. Також потрібно буде регулярно перевіряти, чи зміни, внесені в код (і його залежності), не вплинуть негативно на якість моделі.
Під час виведення результатів потрібен дуже незначний моніторинг вхідних даних.
Навпаки, потрібно відстежувати вхідні дані в робочому режимі. Якщо розподіли вхідних даних зміняться, прогнози моделі можуть стати ненадійними. Уявіть, наприклад, що модель, навчену лише на даних про літній одяг, раптом використовують, щоб прогнозувати тенденції поведінки покупців зимового одягу.
Яке одне з наведених нижче тверджень щодо динамічного (онлайн-) навчання правильне?
Модель оновлюється, коли надходять нові дані.
Це основна перевага навчання онлайн; можна уникнути багатьох проблем із застарілістю, якщо дозволити моделі навчатися на нових даних, щойно вони надходять.
Не потрібно витрачати багато часу на контроль за тренувальними завданнями.
Насправді потрібно постійно стежити за тренувальними завданнями, щоб гарантувати їх якість і належну роботу. Вам також знадобиться допоміжна інфраструктура, зокрема можливість повернути модель до попереднього знімка стану, якщо під час навчання щось піде не так, наприклад, станеться помилка чи спотворяться вхідні дані.
Під час виведення результатів потрібен дуже незначний моніторинг вхідних даних.
Важливо контролювати вхідні дані як статичних офлайн-моделей, так і тих, що оновлюються динамічно. Найімовірніше, ризик впливу сезонних коливань буде невеликим, але раптові значні зміни вхідних даних (наприклад, погіршення якості їх джерела на вищому рівні) усе одно можуть призвести до ненадійних прогнозів.