大语言模型:测试您的知识

  1. 以下短语中有多少二克(二元语法):

    they visited New York last week

  2. 与其他类型的语言模型相比,大型语言模型的哪些特性可以帮助他们做出更好的预测?(请选择所有适用选项)

    选择合适的多项回答。

  3. 判断正误:完整的 Transformer 由编码器和解码器组成。

  4. LLM 使用包含以下示例的大型数据语料库进行训练:

    My cousin's new fashion line is so cool!

    什么机制可以帮助 LLM 学到“很酷”这个句子最可能的意思是“很好”而不是衣服的温度?

  5. 在以下关于微调与蒸馏的表述中,哪一项是正确的?