При реализации модели начните с простого. Большая часть работы в ML выполняется на стороне данных, поэтому запустить полный конвейер для сложной модели сложнее, чем выполнять итерацию самой модели. После настройки конвейера данных и реализации простой модели, использующей несколько функций, вы можете приступить к созданию лучшей модели.
Простые модели обеспечивают хорошую основу, даже если вы в конечном итоге не запустите их. На самом деле, использование простой модели, вероятно, лучше, чем вы думаете. Начав с простого, вы сможете определить, оправдана ли вообще сложная модель.
Обучите свою собственную модель вместо использования уже обученной модели.
Обученные модели существуют для различных вариантов использования и предлагают множество преимуществ. Однако обученные модели действительно работают только в том случае, если метка и функции точно соответствуют вашему набору данных. Например, если обученная модель использует 25 функций, а ваш набор данных включает только 24 из них, обученная модель, скорее всего, будет давать неверные прогнозы.
Обычно специалисты по машинному обучению используют соответствующие подразделы входных данных обученной модели для точной настройки или переноса обучения. Если обученной модели для вашего конкретного варианта использования не существует, рассмотрите возможность использования подразделов обученной модели при обучении собственной.
Информацию об обученных моделях см.
Мониторинг
При формулировании проблемы рассмотрите инфраструктуру мониторинга и оповещения, необходимую вашему решению ML.
Развертывание модели
В некоторых случаях недавно обученная модель может быть хуже, чем модель, находящаяся в производстве в настоящее время. Если это так, вам следует запретить его выпуск в рабочую среду и получить предупреждение о сбое автоматического развертывания.
Перекос в обучении и обслуживании
Если какая-либо из входящих функций, используемых для вывода, имеет значения, выходящие за пределы диапазона распределения данных, используемых при обучении, вы захотите получить предупреждение, поскольку вполне вероятно, что модель будет давать неверные прогнозы. Например, если ваша модель была обучена прогнозировать температуру для экваториальных городов на уровне моря, то ваша обслуживающая система должна предупреждать вас о входящих данных с широтой и долготой и/или высотой за пределами диапазона, на котором обучалась модель. И наоборот, обслуживающая система должна предупредить вас, если модель делает прогнозы, выходящие за пределы диапазона распределения, который наблюдался во время обучения.
Сервер вывода
Если вы предоставляете выводы через систему RPC, вам нужно будет отслеживать сам сервер RPC и получать оповещения, если он перестанет предоставлять выводы.