近年、ChatGPTやAutoGPT、BabyAGIといった大規模言語モデル(LLM)を活用したAIエージェントが注目を集めています。これらのエージェントは、ユーザーの目標を理解し、自律的に計画を立てて実行する能力を持っています。しかし、以下のような課題が存在します。
- • 計画生成時の不確実性:LLMの推論には不確実性が伴い、長期的な計画では小さな誤差が全体の成功率に大きな影響を与える可能性があります。
- • 説明可能性の欠如:LLMの内部構造が複雑であるため、エージェントの推論過程が「ブラックボックス」となり、信頼性や透明性に課題があります。
- • 責任の所在の曖昧さ:エージェントが他のエージェントやツールを利用する場合、責任の所在が不明確になることがあります。
これらの課題に対処するため、本論文では18のアーキテクチャパターンを提案し、エージェント設計の指針を提供しています。
パターン分類(4つのカテゴリと概要)
- 目標設定と計画生成:エージェントがユーザーの目的を正しく理解し、具体的なタスク計画に明確に落とし込むためのパターン群。ユーザーからの曖昧な要求を精緻化したり、情報を外部から収集して目標を明確化するなど、計画策定のプロセスを強化します。
- 推論の確実性向上:エージェントが生成した推論結果や計画の信頼性を高めるために、自己・相互・人間による振り返りを行い、結果を検証・改善するパターン群。誤りのリスクを軽減し、透明性を向上させます。
- エージェント間の協調:単一のエージェントでは難しい課題に対して、複数エージェントが協調し解決を図るパターン群。投票型、役割分担型、討論型などの多様な協調メカニズムを提供します。
- 入出力制御:エージェントの入出力情報を適切に管理し、誤解や不適切な出力を防ぐためのパターン群。プロンプト最適化やガードレール、エージェント評価の仕組みを整えることで、エージェントの安全性と規範適合性を確保します。
各パターンの解説(18種)
目標設定と計画生成に関するパターン
- Passive Goal Creator:ユーザーの明示的な指示を解析し、対話を通じて目標を設定します。
- Proactive Goal Creator:ユーザーの行動やコンテキストを理解し、目標を予測・設定します。
- プロンプト/レスポンス最適化:入力・出力の形式や内容を最適化し、標準化や適応性を向上させます。
- RAG(検索拡張生成):外部知識を活用して、エージェントの知識更新性を高めます。
- ワンショットモデル問い合わせ:単一のモデル呼び出しで計画全体を生成し、コスト効率を向上させます。
- 逐次モデル問い合わせ:段階的にモデルを呼び出し、推論の確実性と説明可能性を高めます。
- Single-path Plan Generator:単一の計画経路を生成し、効率性と一貫性を確保します。
- Multi-path Plan Generator:複数の計画経路を生成し、柔軟性と適応性を向上させます。
推論の確実性向上に関するパターン
- 自己リフレクション:エージェント自身で出力を見直し修正。
- 相互リフレクション:複数エージェントが互いにレビュー。
- 人間リフレクション:人間が途中結果をレビューしフィードバック。
エージェント間の協調に関するパターン
- 投票型協調:各エージェントの案を投票で選択。
- 役割ベース協調:エージェントに役割と権限を割り当て協調。
- 討論ベース協調:議論を通じて合意に到達。
- ツール/エージェント登録簿:利用可能なツール・エージェントを管理。
入出力制御に関するパターン
- マルチモーダル・ガードレール:テキスト・画像・音声など出力を監視・制御。
- エージェントアダプタ:異なるツール・サービスとのインタフェース仲介。
- エージェント評価者:エージェントの性能・信頼性を評価。
まとめ(パターン活用のメリットと展望)
Yue LiuらによるAIエージェントの設計パターンを活用することで、目標設定・出力信頼性向上・協調・安全性確保といった観点から開発効率・品質・安全性を高められます。今後はこれらパターンを組み合わせた設計指針やツールも整備されると見込まれ、実ビジネスへの応用が期待されます。
参考文献
Liu, Yue, et al. “Agent Design Pattern Catalogue: A Collection of Architectural Patterns for Foundation Model based Agents.” (2024)