安全な AI フレームワーク(SAIF): 安全な AI システムのためのコンセプト フレームワーク

AI は急速に進歩しており、それに伴い効果的なリスク管理戦略が進化することが重要です。セキュア AI フレームワーク(SAIF)は、この進化を実現するために設計された、安全な AI システムに関するコンセプト フレームワークです。

世界中のプロダクトで AI 機能がますます統合されるにつれて、大胆で責任あるフレームワークに従うことがさらに重要になります。

SAIF は、モデルの盗難トレーニング データのデータ ポイズニングプロンプト インジェクションによる悪意のある入力の挿入、トレーニング データの機密情報の抽出など、AI システムに固有のリスクを軽減するように設計されています。

SAIF フレームワーク

SAIF には次の 6 つのコア要素があります。

1. 強固なセキュリティ基盤を AI エコシステムに拡大

これには、デフォルトで安全なインフラストラクチャの保護と、過去 20 年間にわたって構築されたエキスパティーズを活用して、AI システム、アプリケーション、ユーザーを保護することが含まれます。同時に、AI の進歩に対応するために組織の専門知識を身に付け、AI と進化する脅威モデルのコンテキスト下でインフラストラクチャの保護をスケーリングし、適応させます。たとえば、SQL インジェクションなどのインジェクション手法は以前から存在していました。組織は入力サニタイズや制限などの緩和策を適応させて、プロンプト インジェクション型攻撃に対する防御を強化できます。

2. 検出と対応を拡大し、AI を組織の脅威の領域に導入する

適時性は、AI 関連のサイバー インシデントを検出して対応するうえで重要です。また、脅威インテリジェンスやその他の機能を組織に拡張することで、いずれも改善できます。組織の場合、たとえば、生成された AI システムの入出力をモニタリングして異常を検出し、脅威インテリジェンスを使用して攻撃を予測します。通常、この作業には、信頼性と安全性、脅威インテリジェンス、不正行為対策チームとの協力が必要です。

3. 防御を自動化して、既存の脅威や新しい脅威に対応

最新の AI イノベーションは、セキュリティ インシデントへの対応規模とスピードを向上させることができます。攻撃者は AI を使用して影響を拡大する可能性が高いため、AI とその最新能力を使用して、俊敏性と費用対効果を維持しながら攻撃者から保護することが重要です。

4. プラットフォーム レベルの制御を調整して、組織全体で一貫したセキュリティを確保する

制御フレームワーク間の整合性は、さまざまなプラットフォームとツールにわたって AI のリスク軽減とスケーリング保護をサポートし、すべての AI アプリケーションでスケーラブルかつ費用対効果の高い方法で最良の保護を利用できるようにします。Google では、デフォルトで保護されている Vertex AI や Security AI Workbench などの AI プラットフォームへの保護の拡張や、ソフトウェア開発ライフサイクルへの制御と保護の組み込みを行っています。Perspective API など、一般的なユースケースに対応する機能は、最先端の保護対策を組織全体に導入する際に役立ちます。

5. 制御を調整し、緩和策を調整し、AI のデプロイのためのより迅速なフィードバック ループを作成する

継続的な学習による実装の継続的なテストにより、検出と保護の機能が変化する脅威の環境に対処できます。これには、インシデントやユーザー フィードバックに基づく強化学習などの手法が含まれ、トレーニング データセットの更新、攻撃に戦略的に応答するためのモデルの微調整、モデルの構築に使用するソフトウェアによるコンテキスト内の埋め込みセキュリティの強化(異常な動作の検出など)などの手順が含まれます。組織は、レッドチームを定期的に実施して、AI を活用したプロダクトや機能の安全保証を改善することもできます。

6. 周辺のビジネス プロセスにおける AI システムのリスクのコンテキスト化

最後に、組織が AI をデプロイする方法に関するエンドツーエンドのリスク評価を実施することで、情報に基づいた意思決定を行うことができます。これには、特定の種類のアプリケーションにおけるデータリネージ、検証、運用動作のモニタリングなどのエンドツーエンドのビジネスリスクの評価が含まれます。また、AI パフォーマンスを検証する自動チェックを作成する必要があります。

その他のリソース

SAIF を実装するための実務担当者向けガイド。このガイドでは、既存または新規の AI の採用において、組織が SAIF のアプローチをどのように構築するかについて、実践的な概要を説明します。

Red Teams Play a Central Role in Helping Organizations Secure AI Systems」は、SAIF フレームワーク(レッドチーム化)をサポートする重要な機能のデプロイに関する詳細なレポートです。これには、次の 3 つの重要な領域が含まれます。

  1. レッドチームの役割とその重要性
  2. レッドチームが実施する攻撃の種類
  3. 他の人と共有できる教訓