Введение в модели ИИ на GPU-викторине

В чем ключевое различие между обучением и выводом?

Обучение использует только прямой проход; вывод использует прямой и обратный проход

Обучение обновляет веса; вывод не обновляет веса

Для вывода требуются большие наборы данных, чем для обучения

Вывод всегда использует ЦП

Степень сжатия тренировочных журналов

Как сериализуются веса, смещения и метаданные

Количество токенов, которые может сгенерировать модель

Как планируются графические процессоры

Переносные контрольно-пропускные пункты для исследований

Форматы обмена, не зависящие от поставщика

Оптимизированные для GPU двоичные файлы, скомпилированные для конкретного оборудования

Легкие форматы, разработанные сообществом

Они используют меньше ядер

Они имеют тысячи параллельных ядер, оптимизированных для матричной математики.

Они потребляют много энергии на ядро.

Они обрабатывают более разнообразные инструкции

Значение задержки, при котором пропускная способность падает

Точка, в которой пропускная способность увеличивается без существенного увеличения задержки

Самая медленная наблюдаемая задержка

Минимальный объем памяти, достижимый для модели, независимо от компромиссов в плане производительности