Великі мовні моделі: перевірте свої знання Return to pathway Скільки 2-грам (біграм) міститься у фразі: they visited New York last week 3 4 5 6 Які атрибути великих мовних моделей допомагають їм робити кращі прогнози, ніж ті, які видають інші типи мовних моделей? (Виберіть усі варіанти, які підходять.) Choose as many answers as you see fit. Великі мовні моделі містять набагато більше параметрів. Великі мовні моделі отримують більше контексту. Великі мовні моделі не обов’язково навчати на великій кількості даних. Великі мовні моделі ніколи не мають "галюцинацій". Правда чи неправда: повний трансформер складається з кодера й декодера. Правда Неправда Велика мовна модель навчається на великому масиві даних, у якому є такий приклад: My cousin's new fashion line is so cool! Який механізм допомагає великій мовній моделі дізнатися, що в цьому реченні cool (прохолодний/чудовий), швидше за все, означає "чудова", а не стосується температури одягу? Інженерія запитів Декодер Дистиляція Самоувага Яке з тверджень щодо донавчання й дистиляції, наведених нижче, правдиве? Донавчання збільшує кількість параметрів, яку має модель, тоді як дистиляція зменшує її. Зазвичай донавчання підвищує якість прогнозів моделі, тоді як дистиляція знижує її. Донавчання виконується на текстових моделях, тоді як дистиляція – на моделях зображень. Усі твердження, наведені вище, неправдиві. Submit answers error_outline An error occurred when grading the quiz. Please try again.