Agent 的六大核心能力

把一个 Agent 拆开,大致是六种能力在协同工作。看懂它们,是最快理解"Agent 能帮你做什么、不能做什么"的方式。

感知

Agent 先接收情境:你的需求、文档、来自其他系统的数据,或实时输入。这是它在行动前"看清现状"的方式。

它不急着秒回,而是把目标想清楚,拆成有先后顺序的步骤——相当于给自己列一张待办清单,并决定先做哪一步。

这是杠杆最高的一项能力:Agent 伸手去用真实软件——搜索、发邮件、运行代码、查询数据库。你定义好工具,模型决定何时调用,并返回一个结构化请求,由你的程序去执行。

Agent 在一个任务里(有时跨越数天)保留上下文,使每一步都不必从零开始,保持连贯与个性化。

给定一个目标,Agent 自己跑一个循环:行动、观察结果、调整、继续,跨越许多步骤直到完成——不需要人一个个按按钮。

面对更大的任务,多个各有所长的 Agent 可以组队,各管一段,朝共同目标协作。

01
AWS — 什么是 AI 智能体?
中立厂商科普;对各项能力定义清晰。
https://aws.amazon.com/what-is/ai-agents/
02
Google Cloud — 什么是 AI 智能体?
科普解释;"大模型是智能体的大脑"。
https://cloud.google.com/discover/what-are-ai-agents
03
IBM — 什么是 AI 智能体?
中立主题解释;工具调用与自主性。
https://www.ibm.com/think/topics/ai-agents
04
Anthropic — 工具调用(function calling)概览
一手来源;模型如何调用工具。
https://platform.claude.com/docs/en/agents-and-tools/tool-use/overview
05
IBM — 多智能体系统
多个智能体协作达成目标。
https://www.ibm.com/think/topics/multiagent-system