Grands modèles de langage: tester vos connaissances

  1. Combien de 2 grammes (bigrammes) sont présents dans l'expression suivante:

    they visited New York last week

  2. Quels attributs des grands modèles de langage lui permettent d'obtenir de meilleures prédictions que les autres types de modèles de langage ? (Sélectionnez toutes les réponses qui s'appliquent.)

    Choisissez autant de réponses que vous jugez nécessaires.

  3. Vrai ou faux: un modèle Transformer complet se compose à la fois d'un encodeur et d'un décodeur.

  4. Un LLM est entraîné sur un vaste corpus de données qui inclut l'exemple suivant:

    My cousin's new fashion line is so cool!

    Quel mécanisme permet au LLM d'apprendre que dans cette phrase, "cool" signifie très probablement "excellent" et ne se réfère pas à la température des vêtements ?

  5. Parmi les affirmations suivantes concernant l'affinage et la distillation, laquelle est vraie ?