Model Bahasa Besar: Uji Pengetahuan Anda

  1. Berapa banyak 2 gram (bigram) yang ada dalam frasa berikut:

    they visited New York last week

  2. Manakah atribut model bahasa besar yang membantu mereka membuat prediksi yang lebih baik daripada jenis model bahasa lainnya? (Pilih semua yang sesuai)

    Pilih sebanyak mungkin jawaban yang Anda inginkan.

  3. Benar atau Salah: Transformator lengkap terdiri dari encoder dan decoder.

  4. LLM dilatih pada korpus data besar yang mencakup contoh berikut:

    My cousin's new fashion line is so cool!

    Mekanisme apa yang membantu LLM mengetahuinya dalam kalimat ini, "keren" kemungkinan besar berarti "hebat" dan tidak mengacu pada suhu pakaian?

  5. Manakah dari pernyataan berikut yang benar tentang fine-tuning vs. distilasi?