Системи машинного навчання, які працюють у реальних умовах: перевірте свої знання

  1. Ви використовуєте машинне навчання для побудови моделі класифікації, яка прогнозує появу єдинорога. У вашому наборі даних є по 10 000 випадків появи й відсутності єдинорогів. У наборі даних є такі ознаки, як місцезнаходження, час доби, висота над рівнем моря, температура, вологість, щільність зелених насаджень, наявність веселки тощо.

    Після запуску інструмента, що прогнозує появу єдинорога, вам потрібно підтримувати актуальність моделі, повторно навчаючи її на нових даних. Оскільки нових даних для навчання надходить забагато, ви вирішили встановити проміжок часу, протягом якого вони збиратимуться, щоб обмежити їх кількість. Вам також потрібно враховувати денні й річні закономірності появи єдинорога. Який проміжок часу ви виберете?

  2. Ви запустили інструмент, що прогнозує появу єдинорога. Він працює добре. Ви їдете у відпустку, а через три тижні повертаєтеся й бачите, що якість моделі значно знизилася. Припустіть, що для поведінки єдинорога нехарактерно істотно змінюватися за три тижні. Як пояснити зниження якості? Виберіть найімовірніший варіант.

  3. Ви переглядаєте прогнози для Антарктики й виявляєте, що вони погані, відколи ви почали використовувати модель у робочому середовищі. Який із варіантів, наведених нижче, може бути причиною проблеми?

  4. Ваш інструмент, що прогнозує появу єдинорога, працював протягом року. Ви усунули багато проблем, і якість стала високою. Однак ви помітили невелику, але постійну проблему. Якість прогнозів моделі щодо міського середовища дещо знизилася. Що може бути причиною?

  5. Ви вирішили наявні проблеми й значно покращили якість моделі, що прогнозує появу єдинорогів, завдяки чому її використання зросло вдесятеро. Однак тепер користувачі скаржаться, що модель працює надзвичайно повільно. Після запиту на виведення результатів зазвичай проходить більше ніж 30 секунд, перш ніж користувач отримує прогноз. Що з описаного нижче слід зробити, щоб вирішити цю проблему?