このページは Cloud Translation API によって翻訳されました。

機械学習用語集: ジェネレーティブ AI

このページでは、生成 AI の用語集の用語について説明します。用語集のすべての用語については、こちらをクリックしてください。

A

適応

#generativeAI

チューニングまたはファインチューニングと同義。

自動評価

#generativeAI

ソフトウェアを使用してモデルの出力の品質を判断する。

モデルの出力が比較的単純な場合は、スクリプトまたはプログラムでモデルの出力をゴールデンレスポンスと比較できます。このタイプの自動評価は、プログラマティック評価と呼ばれることもあります。ROUGE や BLEU などの指標は、プログラムによる評価に役立つことがよくあります。

モデルの出力が複雑な場合や、正解が 1 つではない場合は、自動採点者と呼ばれる別の ML プログラムが自動評価を行うことがあります。

人間による評価と比較してください。

自動評価

#generativeAI

人間による評価と自動評価を組み合わせた、生成 AI モデルの出力の品質を判定するハイブリッドメカニズム。自動評価ツールは、人間による評価で作成されたデータでトレーニングされた ML モデルです。理想的には、自動評価ツールは人間の評価者を模倣することを学習します。

事前構築された自動評価ツールを使用できますが、最適な自動評価ツールは、評価するタスクに合わせて特別にファインチューニングされています。

自己回帰モデル

#generativeAI

独自の以前の予測に基づいて予測を推論するモデル。たとえば、自己回帰言語モデルは、以前に予測されたトークンに基づいて次のトークンを予測します。Transformer ベースの大規模言語モデルはすべて自動回帰です。

一方、GAN ベースの画像モデルは、通常、自己回帰ではありません。これは、画像をステップごとに反復的に生成するのではなく、単一のフォワードパスで生成するためです。ただし、一部の画像生成モデルは、画像を段階的に生成するため、自己回帰型です。

B

ベースモデル

#generativeAI

特定のタスクやアプリケーションに対応するためのファインチューニングの出発点として使用できる事前トレーニング済みモデル。

事前トレーニング済みモデルと基盤モデルもご覧ください。

C

Chain-of-Thought プロンプト

#generativeAI

大規模言語モデル（LLM）に推論を段階的に説明させるプロンプトエンジニアリング手法。たとえば、次のプロンプトについて考えてみましょう。特に 2 文目に注目してください。

時速 0 マイルから時速 60 マイルまで 7 秒で加速する車に乗っているドライバーが受ける G フォースはどのくらいですか？回答には、関連する計算をすべて示してください。

LLM のレスポンスは、次のようになります。

物理の公式のシーケンスを表示し、適切な場所に 0、60、7 の値を代入します。
選択した数式とその理由、さまざまな変数の意味を説明します。

Chain-of-thought プロンプトを使用すると、LLM はすべての計算を実行する必要があるため、より正確な回答が得られる可能性があります。また、連鎖思考プロンプトを使用すると、ユーザーは LLM の手順を調べて、回答が妥当かどうかを判断できます。

チャット

#generativeAI

ML システム（通常は大規模言語モデル）とのやり取りの内容。チャットでの以前のやり取り（入力した内容と大規模言語モデルの回答）が、チャットの後続部分のコンテキストになります。

chatbot は大規模言語モデルのアプリケーションです。

コンテキスト化された言語エンベディング

#generativeAI

流暢な人間の話者が単語やフレーズを理解する方法に近い方法で、単語やフレーズを「理解」するエンベディング。コンテキスト化された言語エンベディングは、複雑な構文、セマンティクス、コンテキストを理解できます。

たとえば、英語の単語「cow」のエンベディングについて考えてみましょう。word2vec などの古いエンベディングでは、cow から bull までのエンベディング空間内の距離が、ewe（雌羊）から ram（雄羊）までの距離や、female から male までの距離に似るように、英単語を表現できます。コンテキスト化された言語エンベディングは、英語話者が「cow」という単語を牛または雄牛の意味でカジュアルに使用することがあることを認識することで、さらに一歩進むことができます。

コンテキストウィンドウ

#generativeAI

モデルが特定のプロンプトで処理できるトークンの数。コンテキストウィンドウが大きいほど、モデルはより多くの情報を使用して、プロンプトに明解で一貫性のある回答を提供できます。

D

直接プロンプト

#generativeAI

ゼロショットプロンプトと同義。

での精製

#generativeAI

1 つのモデル（教師と呼ばれる）のサイズを、元のモデルの予測を可能な限り忠実にエミュレートする小さなモデル（生徒と呼ばれる）に縮小するプロセス。蒸留が有用なのは、小規模なモデルには大規模なモデル（教師）よりも 2 つの大きなメリットがあるためです。

推論時間の短縮
メモリとエネルギー使用量の削減

ただし、生徒の予測は通常、教師の予測ほど正確ではありません。

抽出では、生徒モデルと教師モデルの予測の出力の差に基づいて、損失関数を最小限に抑えるように生徒モデルをトレーニングします。

蒸留と次の用語を比較対照します。

ファインチューニング
プロンプトベースの学習

詳細については、ML 集中講座の LLM: ファインチューニング、蒸留、プロンプトエンジニアリングをご覧ください。

E

evals

#generativeAI

#Metric

主に LLM 評価の略語として使用されます。広義には、evals は、評価のあらゆる形式の略語です。

評価

#generativeAI

#Metric

モデルの品質を測定したり、異なるモデルを比較したりするプロセス。

教師あり機械学習モデルを評価するには、通常、検証セットとテストセットに対してモデルを評価します。LLM の評価では、通常、品質と安全性のより広範な評価が行われます。

F

事実性

#generativeAI

ML の世界では、出力が現実に基づいているモデルを表すプロパティ。事実性は指標ではなくコンセプトです。たとえば、次のようなプロンプトを大規模言語モデルに送信するとします。

食塩の化学式は何ですか？

事実性を最適化するモデルは次のように応答します。

NaCl

すべてのモデルは事実に基づいているべきだと考えるのは当然です。ただし、次のようなプロンプトでは、生成 AI モデルは事実性ではなく創造性を最適化する必要があります。

宇宙飛行士とイモムシについての韻を踏んだ詩を教えて。

結果として得られるリメリックは、現実に基づいたものにはならない可能性があります。

グラウンディングと比較してください。

高速減衰

#generativeAI

LLM のパフォーマンスを向上させるためのトレーニング手法。高速減衰では、トレーニング中に学習率を急速に減衰させます。この戦略は、モデルがトレーニングデータに過剰適合するのを防ぎ、一般化を改善するのに役立ちます。

少数ショットプロンプト

#generativeAI

大規模言語モデルにどのように回答すればよいかを示す例を複数（少数）含むプロンプト。たとえば、次の長いプロンプトには、大規模言語モデルにクエリへの回答方法を示す 2 つの例が含まれています。

1 つのプロンプトの構成要素	メモ
`指定された国の公式通貨は何ですか？`	LLM に回答してほしい質問。
`フランス: EUR`	例 1:
`英国: GBP`	別の例。
`インド:`	実際のクエリ。

一般的に、少数ショットプロンプトは、ゼロショットプロンプトやワンショットプロンプトよりも望ましい結果が得られます。ただし、少数ショットプロンプトでは長いプロンプトが必要になります。

少数ショットプロンプトは、プロンプトベースの学習に適用される少数ショット学習の一種です。

詳細については、ML 集中講座のプロンプトエンジニアリングをご覧ください。

ファインチューニング

#generativeAI

パラメータを特定のユースケースに合わせて最適化するために、事前トレーニングされたモデルに対してさらに行うタスク固有のトレーニングです。たとえば、一部の大規模言語モデルの完全なトレーニングシーケンスは次のとおりです。

事前トレーニング: すべての英語の Wikipedia ページなど、大規模な一般的なデータセットで大規模言語モデルをトレーニングします。
ファインチューニング: 事前トレーニング済みモデルをトレーニングして、医療に関する質問への回答などの特定のタスクを実行します。通常、ファインチューニングでは、特定のタスクに焦点を当てた数百または数千の例を使用します。

別の例として、大規模な画像モデルの完全なトレーニングシーケンスは次のようになります。

事前トレーニング: Wikimedia Commons のすべての画像など、膨大な一般的な画像データセットで大規模な画像モデルをトレーニングします。
ファインチューニング: シャチの画像を生成するなど、特定のタスクを実行するように事前トレーニング済みモデルをトレーニングします。

ファインチューニングでは、次の戦略を任意に組み合わせることができます。

事前トレーニング済みモデルの既存のパラメータをすべて変更する。これは「フルファインチューニング」と呼ばれることもあります。
事前トレーニング済みモデルの既存のパラメータの一部（通常は出力レイヤに最も近いレイヤ）のみを変更し、他の既存のパラメータ（通常は入力レイヤに最も近いレイヤ）は変更しない。パラメータ効率チューニングをご覧ください。
通常、出力レイヤに最も近い既存のレイヤの上にレイヤを追加します。

ファインチューニングは、転移学習の一種です。そのため、ファインチューニングでは、事前トレーニング済みモデルのトレーニングに使用されたものとは異なる損失関数やモデルタイプが使用されることがあります。たとえば、事前トレーニング済みの大規模な画像モデルをファインチューニングして、入力画像内の鳥の数を返す回帰モデルを作成できます。

ファインチューニングと次の用語を比較対照します。

蒸留
プロンプトベースの学習

詳細については、ML 集中講座のファインチューニングをご覧ください。

フラッシュモデル

#generativeAI

速度と低レイテンシ向けに最適化された、比較的小さな Gemini モデルのファミリー。Flash モデルは、迅速なレスポンスと高いスループットが重要な幅広いアプリケーション向けに設計されています。

基盤モデル

#generativeAI

#Metric

膨大で多様なトレーニングセットでトレーニングされた、非常に大規模な事前トレーニング済みモデル。基盤モデルは、次の両方を行うことができます。

幅広いリクエストに適切に対応する。
追加のファインチューニングやその他のカスタマイズのベースモデルとして機能します。

つまり、基盤モデルは一般的な意味ですでに非常に有能ですが、特定のタスクに対してさらに有用になるようにカスタマイズできます。

成功の割合

#generativeAI

#Metric

ML モデルの生成されたテキストを評価するための指標。成功の割合は、生成されたテキスト出力の総数で「成功」した生成テキスト出力の数を割った値です。たとえば、大規模言語モデルが 10 個のコードブロックを生成し、そのうち 5 個が成功した場合、成功率は 50% になります。

成功率の指標は統計全体で広く使用されていますが、ML では主にコード生成や数学の問題などの検証可能なタスクの測定に役立ちます。

G

Gemini

#generativeAI

Google の最先端 AI で構成されるエコシステム。このエコシステムの要素は次のとおりです。

さまざまな Gemini モデル。
Gemini モデルへのインタラクティブな会話型インターフェース。ユーザーがプロンプトを入力すると、Gemini がそのプロンプトに応答します。
各種 Gemini API。
Gemini モデルに基づくさまざまなビジネスプロダクト（Gemini for Google Cloud など）。

Gemini モデル

#generativeAI

Google の最先端の Transformer ベースのマルチモーダルモデル。Gemini モデルは、エージェントと統合するように特別に設計されています。

ユーザーは、対話型ダイアログインターフェースや SDK など、さまざまな方法で Gemini モデルを操作できます。

Gemma

#generativeAI

Gemini モデルの作成に使用されたものと同じ研究とテクノロジーに基づいて構築された、軽量なオープンモデルのファミリーです。Gemma モデルにはいくつかの種類があり、それぞれにビジョン、コード、指示の実行などの異なる機能が用意されています。詳しくは、Gemma をご覧ください。

GenAI または genAI

#generativeAI

生成 AI の略語。

生成されたテキスト

#generativeAI

一般に、ML モデルが出力するテキスト。大規模言語モデルを評価する際、一部の指標では、生成されたテキストと参照テキストを比較します。たとえば、ML モデルがフランス語からオランダ語にどれだけ効果的に翻訳できるかを判断しようとしているとします。この例の場合は、次のようになります。

生成されたテキストは、ML モデルが出力するオランダ語の翻訳です。
参照テキストは、人間の翻訳者（またはソフトウェア）が作成したオランダ語の翻訳です。

評価戦略によっては、参照テキストを使用しないものもあります。

生成 AI

#generativeAI

正式な定義のない、変革的な新しい分野です。ただし、ほとんどの専門家は、生成 AI モデルは次のすべての条件を満たすコンテンツを作成（「生成」）できるという点で一致しています。

複雑
一貫性のある
オリジナル

生成 AI の例:

大規模言語モデル。高度なオリジナルのテキストを生成し、質問に答えることができます。
独自の画像を生成できる画像生成モデル。
オーディオと音楽の生成モデル。オリジナルの音楽を作曲したり、リアルな音声を生成したりできます。
オリジナル動画を生成できる動画生成モデル。

LSTM や RNN などの以前のテクノロジーでも、オリジナルで一貫性のあるコンテンツを生成できます。これらの初期のテクノロジーを生成 AI と見なす専門家もいれば、真の生成 AI には、これらの初期のテクノロジーが生成できるよりも複雑な出力が必要だと考える専門家もいます。

予測 ML との対比。

ゴールデンレスポンス

#generativeAI

レスポンスが良好であることがわかっている。たとえば、次のようなプロンプトがあるとします。

2 + 2

理想的な回答は次のとおりです。

4

ゴールデンレスポンスと参照テキストに関する注意事項については、こちらをクリックしてください。

ROUGE などの一部の評価指標は、参照テキストとモデルの生成テキストを比較します。プロンプトに対する正解が 1 つしかない場合、通常、ゴールデンレスポンスは参照テキストとして機能します。

プロンプトによっては、正解が 1 つではないものもあります。たとえば、「このドキュメントを要約してください」というプロンプトには、正解が複数ある可能性があります。このようなプロンプトの場合、モデルが非常に幅広い要約を生成できるため、参照テキストは実用的でないことがよくあります。ただし、この状況ではゴールデンレスポンスが役立つ可能性があります。たとえば、優れたドキュメントの要約を含むゴールデンレスポンスは、優れたドキュメントの要約のパターンを検出するように 自動評価ツールをトレーニングするのに役立ちます。

H

人間による評価

#generativeAI

人が ML モデルの出力の品質を判断するプロセス。たとえば、バイリンガルの人が ML 翻訳モデルの品質を判断します。人間による評価は、正解が 1 つではないモデルを判断する際に特に役立ちます。

自動評価と自動評価ツールによる評価と比較してください。

人間参加型（HITL）

#generativeAI

次のいずれかを意味する可能性のある、緩やかに定義されたイディオム。

生成 AI の出力を批判的または懐疑的に見るポリシー。
モデルの動作をユーザーが形成、評価、改善するための戦略またはシステム。人間をループ内に保持することで、AI は機械知能と人間知能の両方のメリットを享受できます。たとえば、AI がコードを生成し、ソフトウェアエンジニアがそれをレビューするシステムは、人間がループに関与するシステムです。

I

コンテキスト内学習

#generativeAI

少数ショットプロンプトと同義。

推論

#fundamentals

#generativeAI

従来の ML では、トレーニング済みのモデルをラベルなしの例に適用して予測を行うプロセス。詳細については、ML の概要コースの教師あり学習をご覧ください。

大規模言語モデルでは、推論は、トレーニング済みのモデルを使用して、入力プロンプトに対するレスポンスを生成するプロセスです。

推論は、統計ではやや異なる意味を持ちます。詳しくは、統計的推論に関する Wikipedia の記事をご覧ください。

指示チューニング

#generativeAI

生成 AI モデルが指示に従う能力を向上させるファインチューニングの一種。指示チューニングでは、通常はさまざまなタスクを対象とする一連の指示プロンプトでモデルをトレーニングします。その結果、指示チューニングされたモデルは、さまざまなタスクにわたってゼロショットプロンプトに対して有用なレスポンスを生成する傾向があります。

比較対照:

パラメータ効率チューニング
プロンプトチューニング

L

遅延

#generativeAI

モデルが入力を処理してレスポンスを生成するまでにかかる時間。レイテンシの高いレスポンスは、レイテンシの低いレスポンスよりも生成に時間がかかります。

大規模言語モデルのレイテンシに影響する要因は次のとおりです。

入力と出力の [トークン] の長さ
モデルの複雑さ
モデルが実行されるインフラストラクチャ

レイテンシの最適化は、レスポンシブで使いやすいアプリケーションを作成するうえで非常に重要です。

LLM

#generativeAI

大規模言語モデルの略語。

LLM 評価（eval）

#generativeAI

#Metric

大規模言語モデル（LLM）のパフォーマンスを評価するための指標とベンチマークのセット。LLM の評価は、大まかに次のようになります。

研究者が LLM の改善が必要な領域を特定するのに役立ちます。
さまざまな LLM を比較し、特定のタスクに最適な LLM を特定するのに役立ちます。
LLM の使用が安全で倫理的であることを確認します。

詳細については、ML 集中講座の大規模言語モデル（LLM）をご覧ください。

LoRA

#generativeAI

Low-Rank Adaptability の略。

Low-Rank Adaptability（LoRA）

#generativeAI

モデルの事前トレーニング済みの重みを「凍結」（変更できないようにする）してから、トレーニング可能な重みの小さなセットをモデルに挿入する、ファインチューニングのためのパラメータ効率手法。このトレーニング可能な重みのセット（更新行列とも呼ばれます）は、ベースモデルよりもはるかに小さいため、トレーニングがはるかに高速になります。

LoRA には次のような利点があります。

ファインチューニングが適用されるドメインのモデルの予測の品質を向上させます。
モデルのすべてのパラメータのファインチューニングを必要とする手法よりも高速にファインチューニングを行います。
同じベースモデルを共有する複数の特殊モデルの同時サービングを可能にすることで、推論の計算コストを削減します。

アイコンをクリックすると、LoRA の更新マトリックスの詳細を確認できます。

LoRA で使用される更新行列は、ベースモデルから導出されたランク分解行列で構成されています。これは、ノイズをフィルタリングし、モデルの最も重要な特徴にトレーニングを集中させるのに役立ちます。

M

機械翻訳

#generativeAI

ソフトウェア（通常は ML モデル）を使用して、ある言語から別の言語にテキストを変換すること（例: 英語から日本語）。

k での平均適合率の平均（mAP@k）

#generativeAI

#Metric

検証データセット全体でのすべてのk における平均適合率スコアの統計的平均。k における平均適合率の用途の一つは、レコメンデーションシステムによって生成された推奨事項の品質を判断することです。

「平均平均」というフレーズは冗長に聞こえますが、指標の名前としては適切です。この指標は、複数の k における平均適合率の値の平均を求めるためです。

アイコンをクリックすると、例が表示されます。

各ユーザーにパーソナライズされたおすすめの小説のリストを生成するレコメンデーションシステムを構築するとします。選択したユーザーからのフィードバックに基づいて、次の 5 つの平均適合率（k）スコア（ユーザーごとに 1 つのスコア）を計算します。

0.73
0.77
0.67
0.82
0.76

したがって、K における平均適合率の平均は次のようになります。

$$\text{mean } = \frac{\text{0.73 + 0.77 + 0.67 + 0.82 + 0.76}} {\text{5}} = \text{0.75}$$

mixture of experts

#generativeAI

ニューラルネットワークのパラメータのサブセット（エキスパートと呼ばれる）のみを使用して、特定の入力トークンまたは例を処理することで、ニューラルネットワークの効率を高めるスキーム。ゲーティングネットワークは、各入力トークンまたは例を適切なエキスパートに転送します。

詳細については、次のいずれかの論文をご覧ください。

MMIT

#generativeAI

マルチモーダル指示チューニング済みの略。

モデルのカスケード

#generativeAI

特定の推論クエリに最適なモデルを選択するシステム。

非常に大きなモデル（多数のパラメータ）から非常に小さなモデル（パラメータがはるかに少ない）まで、さまざまなモデルのグループを考えてみましょう。非常に大きなモデルは、小さなモデルよりも推論時に多くのコンピューティングリソースを消費します。ただし、非常に大きなモデルは通常、小さなモデルよりも複雑なリクエストを推論できます。モデルカスケードは、推論クエリの複雑さを判断し、推論を実行する適切なモデルを選択します。モデルカスケードの主な目的は、一般的に小規模なモデルを選択し、より複雑なクエリに対してのみ大規模なモデルを選択することで、推論費用を削減することです。

たとえば、スマートフォンで小規模なモデルが実行され、そのモデルのより大規模なバージョンがリモートサーバーで実行されるとします。適切なモデルカスケードにより、小規模なモデルで単純なリクエストを処理し、複雑なリクエストの処理にのみリモートモデルを呼び出すことができるため、費用とレイテンシを削減できます。

モデルルーターもご覧ください。

モデルルーター

#generativeAI

モデルカスケードで推論に最適なモデルを決定するアルゴリズム。モデルルーター自体は通常、特定の入力に最適なモデルを選択する方法を徐々に学習する ML モデルです。ただし、モデルルーターは、よりシンプルな非 ML アルゴリズムである場合もあります。

MOE

#generativeAI

mixture of experts の略。

MT

#generativeAI

機械翻訳の略語。

N

Nano

#generativeAI

デバイスでの使用を想定して設計された、比較的小さな Gemini モデル。詳しくは、Gemini Nano をご覧ください。

Pro と Ultra もご覧ください。

唯一の正解はない（NORA）

#generativeAI

複数の正解のレスポンスがあるプロンプト。たとえば、次のプロンプトには正解が 1 つありません。

ゾウに関する面白いジョークを教えて。

正解のないプロンプトに対する回答の評価は、通常、正解が 1 つあるプロンプトの評価よりも主観的になります。たとえば、象のジョークを評価するには、ジョークの面白さを判断する体系的な方法が必要です。

NORA

#generativeAI

no one right answer の略語。

Notebook LM

#generativeAI

ユーザーがドキュメントをアップロードし、プロンプトを使用して、ドキュメントに関する質問をしたり、ドキュメントを要約したり、整理したりできる Gemini ベースのツール。たとえば、著者が複数の短編小説をアップロードして、共通のテーマを見つけるよう NotebookLM に依頼したり、どの小説が映画に最適かを特定するよう依頼したりできます。

O

正解が 1 つ（ORA）

#generativeAI

単一の正しいレスポンスを持つプロンプト。たとえば、次のプロンプトについて考えてみましょう。

土星は火星よりも大きい。これは正しいでしょうか、誤りでしょうか。

正しい回答は「true」のみです。

唯一の正解はないを参照してください。

ワンショットプロンプト

#generativeAI

大規模言語モデルにどのように回答すればよいかを示す例を 1 つ含むプロンプト。たとえば、次のプロンプトには、大規模言語モデルがクエリにどのように回答すべきかを示す例が 1 つ含まれています。

1 つのプロンプトの構成要素	メモ
`指定された国の公式通貨は何ですか？`	LLM に回答してほしい質問。
`フランス: EUR`	例 1:
`インド:`	実際のクエリ。

ワンショットプロンプトと次の用語を比較対照します。

ゼロショットプロンプト
少数ショットプロンプト

ORA

#generativeAI

正解が 1 つの略語。

P

パラメータ効率チューニング

#generativeAI

完全なファインチューニングよりも効率的に、大規模な事前トレーニング済み言語モデル（PLM）をファインチューニングする一連の手法。パラメータ効率チューニングでは、通常、完全なファインチューニングよりもはるかに少ないパラメータがファインチューニングされますが、一般に、完全なファインチューニングで構築された大規模言語モデルと同等（またはほぼ同等）のパフォーマンスを発揮する大規模言語モデルが生成されます。

パラメータ効率チューニングと次のものを比較対照します。

指示チューニング
プロンプトチューニング

パラメータ効率チューニングは、パラメータ効率ファインチューニングとも呼ばれます。

Pax

#generativeAI

複数の TPU アクセラレータチップ スライスまたは Pod にまたがるほど大規模な ニューラルネットワーク モデルのトレーニング用に設計されたプログラミングフレームワーク。

Pax は JAX 上に構築された Flax 上に構築されています。

ソフトウェアスタックにおける Pax の位置を示す図。Pax は JAX 上に構築されています。Pax 自体は 3 つのレイヤで構成されています。最下層には TensorStore と Flax が含まれています。中間レイヤには Optax と Flaxformer が含まれています。最上位のレイヤには、Praxis モデリングライブラリが含まれています。Fiddle は Pax の上に構築されています。

PLM

#generativeAI

事前トレーニング済み言語モデルの略語。

事後トレーニング済みモデル

#generativeAI

一般的に、次の 1 つ以上の後処理が行われた事前トレーニング済みモデルを指す、緩やかに定義された用語。

蒸留
ファインチューニング
指示チューニング

事前トレーニング済みモデル

#generativeAI

この用語は、トレーニング済みのモデルまたはトレーニング済みのエンベディングベクトルを指すこともありますが、現在では通常、トレーニング済みの大規模言語モデルまたはトレーニング済みの生成 AI モデルを指します。

ベースモデルと基盤モデルもご覧ください。

事前トレーニング

#generativeAI

大規模なデータセットでのモデルの最初のトレーニング。一部の事前トレーニング済みモデルは扱いにくく、通常は追加のトレーニングで調整する必要があります。たとえば、ML エキスパートは、Wikipedia のすべての英語ページなど、膨大なテキストデータセットで大規模言語モデルを事前トレーニングする場合があります。事前トレーニングの後、次のいずれかの手法でモデルをさらに改良できます。

蒸留
ファインチューニング
指示チューニング
パラメータ効率チューニング
prompt-tuning

Pro

#generativeAI

Ultra よりも少ないが、Nano よりも多いパラメータを持つGemini モデル。詳細については、Gemini Pro をご覧ください。

プロンプト

#generativeAI

大規模言語モデルに入力として入力されるテキスト。モデルが特定の動作をするように条件付けます。プロンプトは、フレーズのように短くすることも、任意に長くすることもできます（小説の全文など）。プロンプトは、次の表に示すカテゴリなど、複数のカテゴリに分類されます。

プロンプトカテゴリ	例	メモ
質問	`ハトはどれくらいの速さで飛ぶことができますか？`
手順	`アービトラージについての面白い詩を書いて。`	大規模言語モデルに何らかの処理を依頼するプロンプト。
例	`Markdown コードを HTML に変換します。例: Markdown: * list item HTML: <ul> <li>list item</li> </ul>`	この例のプロンプトの最初の文は指示です。プロンプトの残りの部分は例です。
ロール	`物理学の博士号を持つ人に、ML トレーニングで勾配降下法が使用される理由を説明してください。`	文の前半は指示、後半の「物理学の博士号を持つ」というフレーズは役割の部分です。
モデルが完了する部分入力	`英国首相の官邸は`	部分入力プロンプトは、この例のように突然終了するか、アンダースコアで終了します。

生成 AI モデルは、テキスト、コード、画像、エンベディング、動画など、ほぼすべてのプロンプトに応答できます。

プロンプトベースの学習

#generativeAI

特定のモデルの機能。任意のテキスト入力（プロンプト）に応じて動作を適応させることができます。一般的なプロンプトベースの学習パラダイムでは、大規模言語モデルがテキストを生成してプロンプトに応答します。たとえば、ユーザーが次のプロンプトを入力したとします。

ニュートンの運動の第 3 法則を要約してください。

プロンプトベースの学習が可能なモデルは、以前のプロンプトに回答するように特別にトレーニングされていません。むしろ、モデルは物理学に関する多くの事実、一般的な言語規則に関する多くのこと、一般的に有用な回答を構成する多くのことを「知って」います。この知識があれば、有用な回答を提供できるはずです。人間からの追加のフィードバック（「その回答は複雑すぎる」、「リアクションとは何ですか？」など）により、一部のプロンプトベースの学習システムでは、回答の有用性を徐々に改善できます。

プロンプト設計

#generativeAI

プロンプトエンジニアリングと同義。

プロンプトエンジニアリング

#generativeAI

大規模言語モデルから望ましいレスポンスを引き出すプロンプトを作成する技術。人間がプロンプトエンジニアリングを行います。適切に構造化されたプロンプトを作成することは、大規模言語モデルから有用なレスポンスを得るために不可欠な要素です。プロンプトエンジニアリングは、次のような多くの要因に左右されます。

大規模言語モデルの事前トレーニングと、場合によってはファインチューニングに使用されるデータセット。
モデルがレスポンスの生成に使用する温度などのデコードパラメータ。

プロンプト設計は、プロンプトエンジニアリングの同義語です。

役立つプロンプトの作成について詳しくは、プロンプト設計の概要をご覧ください。

プロンプトセット

#generativeAI

大規模言語モデルを評価するためのプロンプトのグループ。たとえば、次の図は 3 つのプロンプトで構成されるプロンプトセットを示しています。

LLM への 3 つのプロンプトで 3 つのレスポンスが生成されます。3 つのプロンプトがプロンプトセットです。3 つのレスポンスがレスポンスセットです。

優れたプロンプトセットは、大規模言語モデルの安全性と有用性を徹底的に評価するのに十分な「幅広い」プロンプトのコレクションで構成されています。

レスポンスセットもご覧ください。

プロンプトチューニング

#generativeAI

システムが実際のプロンプトの先頭に追加する「接頭辞」を学習するパラメータ効率チューニング メカニズム。

プロンプトチューニングの一種（プレフィックスチューニングと呼ばれることもあります）では、すべてのレイヤでプレフィックスを先頭に追加します。一方、ほとんどのプロンプトチューニングでは、入力レイヤに接頭辞を追加するだけです。

アイコンをクリックすると、接頭辞の詳細が表示されます。

プロンプトチューニングの場合、「接頭辞」（「ソフトプロンプト」とも呼ばれます）は、実際のプロンプトのテキストトークン埋め込みの先頭に追加される、学習済みのタスク固有のベクトルの集まりです。システムは、他のすべてのモデルパラメータをフリーズし、特定のタスクでファインチューニングすることで、ソフトプロンプトを学習します。

R

参照テキスト

#generativeAI

プロンプトに対するエキスパートの回答。たとえば、次のプロンプトを指定します。

「What is your name?」という質問を英語からフランス語に翻訳してください。

エキスパートの回答は次のようになります。

Comment vous appelez-vous?

さまざまな指標（ROUGE など）は、参照テキストが ML モデルの生成テキストと一致する度合いを測定します。

人間からのフィードバックを用いた強化学習（RLHF）

#generativeAI

人間の評価者からのフィードバックを使用して、モデルの回答の品質を向上させます。たとえば、RLHF メカニズムでは、モデルのレスポンスの品質を 👍 または 👎 の絵文字で評価するようユーザーに求めることができます。システムは、そのフィードバックに基づいて今後のレスポンスを調整できます。

レスポンス

#generativeAI

生成 AI モデルが推論するテキスト、画像、音声、動画。つまり、プロンプトは生成 AI モデルへの入力であり、レスポンスは出力です。

レスポンスセット

#generativeAI

大規模言語モデルが入力プロンプトセットに返すレスポンスのコレクション。

ロールプロンプト

#generativeAI

通常は代名詞の「you」で始まり、生成 AI モデルに、回答を生成する際に特定の人物や役割を演じるよう指示するプロンプト。ロールプロンプトを使用すると、生成 AI モデルが適切な「マインドセット」になり、より有用なレスポンスを生成できます。たとえば、求める回答の種類に応じて、次のロールプロンプトのいずれかが適切である可能性があります。

コンピュータサイエンスの博士号を取得している。

あなたは、プログラミングを始めたばかりの学生に Python について丁寧に説明するのが好きなソフトウェアエンジニアです。

あなたは、非常に特殊なプログラミングスキルを持つアクションヒーローです。Python リストで特定のアイテムを見つけることを保証してください。

S

ソフトプロンプトチューニング

#generativeAI

リソースを大量に消費するファインチューニングを行わずに、特定のタスク用に大規模言語モデルをチューニングする手法。ソフトプロンプトチューニングでは、モデル内のすべての重みを再トレーニングする代わりに、同じ目標を達成するためにプロンプトが自動的に調整されます。

通常、ソフトプロンプトチューニングでは、テキストプロンプトが指定されると、追加のトークンエンベディングがプロンプトに追加され、逆伝播を使用して入力が最適化されます。

「ハード」プロンプトには、トークンエンベディングではなく実際のトークンが含まれます。

T

温度

#generativeAI

モデルの出力のランダム性の度合いを制御するハイパーパラメータ。温度が高いほど、ランダムな出力が多くなり、温度が低いほど、ランダムな出力が少なくなります。

最適な温度は、特定のアプリケーションや文字列の値によって異なります。

U

Ultra

#generativeAI

最も多くのパラメータを持つ Gemini モデル。詳しくは、Gemini Ultra をご覧ください。

Pro と Nano もご覧ください。

V

Vertex

#GoogleCloud

#generativeAI

AI と ML のための Google Cloud のプラットフォーム。Vertex は、Gemini モデルへのアクセスなど、AI アプリケーションの構築、デプロイ、管理のためのツールとインフラストラクチャを提供します。

Z

ゼロショットプロンプト

#generativeAI

大規模言語モデルにどのように回答してほしいかの例が含まれていないプロンプト。次に例を示します。

1 つのプロンプトの構成要素	メモ
`指定された国の公式通貨は何ですか？`	LLM に回答してほしい質問。
`インド:`	実際のクエリ。

大規模言語モデルは、次のいずれかのレスポンスを返す可能性があります。

ルピー
INR
₹
ルピー（インド）
ルピー
インドルピー

どの答えも正しいですが、特定の形式が望ましい場合があります。

ゼロショットプロンプトと次の用語を比較対照します。

ワンショットプロンプト
少数ショットプロンプト

機械学習用語集: ジェネレーティブ AI コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

A

適応

自動評価

自動評価

自己回帰モデル

B

ベースモデル

C

Chain-of-Thought プロンプト

チャット

コンテキスト化された言語エンベディング

コンテキスト ウィンドウ

D

直接プロンプト

での精製

E

evals

評価

F

事実性

高速減衰

少数ショット プロンプト

ファインチューニング

フラッシュ モデル

基盤モデル

成功の割合

G

Gemini

Gemini モデル

Gemma

GenAI または genAI

生成されたテキスト

生成 AI

ゴールデン レスポンス

ゴールデン レスポンスと参照テキストに関する注意事項については、こちらをクリックしてください。

H

人間による評価

人間参加型（HITL）

I

コンテキスト内学習

推論

指示チューニング

L

遅延

LLM

LLM 評価（eval）

LoRA

Low-Rank Adaptability（LoRA）

アイコンをクリックすると、LoRA の更新マトリックスの詳細を確認できます。

M

機械翻訳

k での平均適合率の平均（mAP@k）

アイコンをクリックすると、例が表示されます。

mixture of experts

MMIT

モデルのカスケード

モデルルーター

MOE

MT

N

Nano

唯一の正解はない（NORA）

NORA

Notebook LM

O

正解が 1 つ（ORA）

ワンショット プロンプト

ORA

P

パラメータ効率チューニング

Pax

PLM

事後トレーニング済みモデル

事前トレーニング済みモデル

事前トレーニング

Pro

プロンプト

プロンプトベースの学習

プロンプト設計

機械学習用語集: ジェネレーティブ AI

コンテキストウィンドウ

少数ショットプロンプト

フラッシュモデル

ゴールデンレスポンス

ゴールデンレスポンスと参照テキストに関する注意事項については、こちらをクリックしてください。

ワンショットプロンプト

プロンプトエンジニアリング

プロンプトセット

プロンプトチューニング

レスポンスセット

ロールプロンプト

ソフトプロンプトチューニング

ゼロショットプロンプト