Kuis Pengantar Model AI di GPU | Google for Developers

Apa perbedaan utama antara pelatihan dan inferensi?

Pelatihan hanya menggunakan forward pass; inferensi menggunakan forward + backward

Pelatihan memperbarui bobot; inferensi tidak memperbarui bobot

Inferensi memerlukan set data yang lebih besar daripada pelatihan

Inferensi selalu menggunakan CPU

Rasio kompresi log pelatihan

Cara bobot, bias, dan metadata diserialisasi

Jumlah token yang dapat dihasilkan model

Cara GPU dijadwalkan

Pos pemeriksaan portabel untuk penelitian

Format pertukaran agnostik vendor

Biner yang dioptimalkan GPU dan dikompilasi untuk hardware tertentu

Format ringan berbasis komunitas

Mereka menggunakan lebih sedikit core

GPU memiliki ribuan core paralel yang dioptimalkan untuk matematika matriks

Mereka mengonsumsi banyak daya per core

Mereka menangani petunjuk yang lebih beragam

Nilai latensi saat throughput menurun

Titik saat throughput meningkat tanpa terlalu memengaruhi latensi

Latensi terlama yang diamati

Jejak memori minimal yang dapat dicapai untuk suatu model, terlepas dari trade-off performa