Эта страница переведена с помощью Cloud Translation API. Оптимизируйте свои подборки Сохраняйте и классифицируйте контент в соответствии со своими настройками. Введение в модели ИИ на GPU-викторине Вернуться к курсу В чем ключевое различие между обучением и выводом? Обучение использует только прямой проход; вывод использует прямой и обратный проход Обучение обновляет веса; вывод не обновляет веса Для вывода требуются большие наборы данных, чем для обучения Вывод всегда использует ЦП Что в первую очередь определяют форматы моделей? Степень сжатия тренировочных журналов Как сериализуются веса, смещения и метаданные Количество токенов, которые может сгенерировать модель Как планируются графические процессоры Движки TensorRT лучше всего можно описать следующим образом: Переносные контрольно-пропускные пункты для исследований Форматы обмена, не зависящие от поставщика Оптимизированные для GPU двоичные файлы, скомпилированные для конкретного оборудования Легкие форматы, разработанные сообществом Что делает графические процессоры более подходящими для вывода по сравнению с центральными процессорами? Они используют меньше ядер Они имеют тысячи параллельных ядер, оптимизированных для матричной математики. Они потребляют много энергии на ядро. Они обрабатывают более разнообразные инструкции Что такое «точка перегиба» в оптимизации производительности? Значение задержки, при котором пропускная способность падает Точка, в которой пропускная способность увеличивается без существенного увеличения задержки Самая медленная наблюдаемая задержка Минимальный объем памяти, достижимый для модели, независимо от компромиссов в плане производительности Отправить ответы error_outline При определении оценки по тесту произошла ошибка. Повторите попытку.