Большие языковые модели: проверьте свои знания

  1. Сколько 2-грамм (биграмм) присутствует в следующем словосочетании:

    they visited New York last week

  2. Какие характеристики больших языковых моделей помогают им делать более точные прогнозы, чем другие типы языковых моделей? (Выберите все подходящие варианты)

    Выбирайте столько ответов, сколько считаете нужным.

  3. Верно или неверно: полный преобразователь состоит из кодера и декодера.

  4. Модель LLM обучается на большом корпусе данных, включающем следующий пример:

    My cousin's new fashion line is so cool!

    Какой механизм помогает LLM понять, что в этом предложении слово «прохладно», скорее всего, означает «отлично» и не относится к температуре одежды?

  5. Какое из следующих утверждений о тонкой настройке и дистилляции верно?