Великі мовні моделі: перевірте свої знання

  1. Скільки 2-грам (біграм) міститься у фразі:

    they visited New York last week

  2. Які атрибути великих мовних моделей допомагають їм робити кращі прогнози, ніж ті, які видають інші типи мовних моделей? (Виберіть усі варіанти, які підходять.)

    Choose as many answers as you see fit.

  3. Правда чи неправда: повний трансформер складається з кодера й декодера.

  4. Велика мовна модель навчається на великому масиві даних, у якому є такий приклад:

    My cousin's new fashion line is so cool!

    Який механізм допомагає великій мовній моделі дізнатися, що в цьому реченні cool (прохолодний/чудовий), швидше за все, означає "чудова", а не стосується температури одягу?

  5. Яке з тверджень щодо донавчання й дистиляції, наведених нижче, правдиве?