Agent 的六大核心能力

把一个 Agent 拆开,大致是六种能力在协同工作。看懂它们,是最快理解"Agent 能帮你做什么、不能做什么"的方式。

感知

Agent 先接收情境:你的需求、文档、来自其他系统的数据,或实时输入。这是它在行动前"看清现状"的方式。

规划与推理

它不急着秒回,而是把目标想清楚,拆成有先后顺序的步骤——相当于给自己列一张待办清单,并决定先做哪一步。

工具调用(function calling)

这是杠杆最高的一项能力:Agent 伸手去用真实软件——搜索、发邮件、运行代码、查询数据库。你定义好工具,模型决定何时调用,并返回一个结构化请求,由你的程序去执行。

记忆

Agent 在一个任务里(有时跨越数天)保留上下文,使每一步都不必从零开始,保持连贯与个性化。

自主多步执行

给定一个目标,Agent 自己跑一个循环:行动、观察结果、调整、继续,跨越许多步骤直到完成——不需要人一个个按按钮。

多智能体协作

面对更大的任务,多个各有所长的 Agent 可以组队,各管一段,朝共同目标协作。

参考来源

  1. 01
    AWS — 什么是 AI 智能体?

    中立厂商科普;对各项能力定义清晰。

    https://aws.amazon.com/what-is/ai-agents/

  2. 02
    Google Cloud — 什么是 AI 智能体?

    科普解释;"大模型是智能体的大脑"。

    https://cloud.google.com/discover/what-are-ai-agents

  3. 03
    IBM — 什么是 AI 智能体?

    中立主题解释;工具调用与自主性。

    https://www.ibm.com/think/topics/ai-agents

  4. 04
    Anthropic — 工具调用(function calling)概览

    一手来源;模型如何调用工具。

    https://platform.claude.com/docs/en/agents-and-tools/tool-use/overview

  5. 05
    IBM — 多智能体系统

    多个智能体协作达成目标。

    https://www.ibm.com/think/topics/multiagent-system