AI エージェントとは?
実際に通用する最も短い定義はこうです。チャットボットはあなたの質問に答え、エージェントはあなたのために物事を成し遂げようと働きます。
AI エージェントとは、目標を与えられると、自らの状況を認識し、手順を計画し、ツールを使い、何が起きたかを記憶し、限られた人の操舵のもとで多段階のタスクを完了まで進められるソフトウェアです。AWS はこう端的に表現しています。目標を設定するのは人間だが、エージェントは「その目標を達成するために必要な最善の行動を、自ら選択する」。
エージェントとモデルの関係
大規模言語モデルは「頭脳」です。Google Cloud は LLM をエージェントの頭脳と表現し、言語を処理・生成する一方、他の部分が推論と行動を可能にすると説明します。AWS はモデルを、プロンプトを行動・判断、あるいはツールや記憶への問い合わせへと変換する推論エンジンとして位置づけます。
つまりエージェントとは、モデルに、行動を可能にする部分 — 認識 (状況を取り込む)、計画、ツール使用、記憶 — を加えたものです。モデルは物事を知っており、エージェントは物事を成し遂げます。
実際にはどう見えるか
Berth が管理対象とするツールの提供元である Anthropic は、エージェントを、モデルが「自らのプロセスとツールの使い方を動的に方向づける」システムだと定義しています。実際にはこれは、LLM がツールをループの中で使うことを意味します。行動し、環境から実際のフィードバックを読み取り、進捗を評価し、目標が達成されるまで繰り返すのです。
参考文献
- 01
- 02IBM — AI エージェント vs AI アシスタント
受動的なアシスタント vs 能動的なエージェント。
https://www.ibm.com/think/topics/ai-agents-vs-ai-assistants
- 03
- 04Anthropic — 効果的なエージェントの構築
一次情報。エージェントとワークフローの区別、ツールをループで使うモデル。
https://www.anthropic.com/engineering/building-effective-agents