什么是 AI 代理?

AI 代理是一种由人工智能提供支持的计算机程序,可以代表人类用户自主执行复杂的任务。

学习目标

阅读本文后,您将能够:

  • 描述代理式 AI 的定义
  • 描述 AI 代理的工作原理
  • 了解 AI 代理如何采取行动

复制文章链接

什么是 AI 代理?

AI 代理是一种由人工智能 (AI) 提供支持的计算机程序,即使没有明确的指令,它也可以自主执行任务来协助人类用户。不同于聊天机器人等其他基于 AI 的软件,AI 代理可以在基于特定提示的上下文之外运行。可以这么说,它们能够脱离训练数据并环顾整个世界来查找信息,然后根据这些信息自主采取行动,以实现更大的目标。

AI 代理可以做出决策,从过去的经验中学习,并相应地调整行动。它们甚至可以咨询其他 AI 代理来获取相关信息。人类负责为 AI 代理设定目标,而代理的职责是弄清楚如何实现这些目标。它们可以独立运行,或者只需极少的人工干预就能运行。

AI 代理可以为硬件提供支持(机器人技术)或仅在软件中运行。

代理式 AI 与 AI 代理

AI 代理就是前文所述的软件程序:它们能够自主决策并处理任务。代理式 AI 是 AI 开发领域,它支持构建 AI 代理。(想一想生成式 AI 与个别大型语言模型(例如 Microsoft Copilot)之间的区别,或者想一想“烹饪”与具体菜肴之间的区别。)

代理式 AI 与生成式 AI

生成式 AI (GenAI) 是指一种深度学习模型,它可以根据提示来生成内容。ChatGPT 等 LLM 都属于这类 AI。代理式 AI 则建立在 GenAI 基础之上。LLM 只能通过特定用户界面或 API 对提示做出回复,而 AI 代理则可以超越既定的上下文,甚至在没有提示的情况下也可以执行操作。

大公司的销售主管可能会这样提示大型语言模型 (LLM) 说:“请帮我写一封电子邮件,让我可以发送给我司的 10 个最大客户,邀请他/她们来参加晚宴。”但如果使用代理式 AI,该主管可能会提示 AI 代理说:“请邀请我司的 10 个最大客户来参加晚宴”。换句话说,LLM 可以生成文本,AI 代理则应该能够生成电子邮件文本、在 CRM 中找到排名前 10 的客户,以及发送个性化电子邮件来邀请客户参加活动(前提条件是它拥有足够的权限这样做)。

AI 代理的工作原理是什么?

大型语言模型 (LLM)

AI 代理基于 LLM 而构建。LLM 是一种经过大量样本数据训练的 AI 模型,能够理解人类创建的内容并生成自己的内容。LLM 甚至可以理解不确切的人类提示和请求。

由于 AI 代理基于 LLM 构建,因此,它们可以处理并解读从用户的对话请求到 Web 托管的视频内容等各种数据和内容。AI 代理可以解读来自多种媒体类型的内容,包括:代码、文本、音频、视频等等。然后,他们就可以利用从这些内容中了解到的内容来优化行动。

外部集成与交互

此外,AI 代理具备与世界互动的方式。在机器人技术中,这可能包括物理传感器和摄像头。对于纯软件 AI 代理,这可能有几种形式:

  • 代理可以通过 API 直接接入外部应用
  • 一些 AI 代理可以像人类用户一样与 Web 应用交互,例如填写表单、阅读网页等(它们可能会使用无头浏览器来实现此目的)
  • 一种名为模型上下文协议 (MCP) 的新兴标准,可以将 AI 代理连接到各种工具(电子邮件客户端、CRM、账单系统等),并让代理进行适当的身份验证和授权。

这些与 AI 代理环境之外的世界进行交互的方式,让 AI 代理能够采取行动。企业可以制定 AI 代理的防护措施,以帮助确保它们采取的行动正确无误,就像人类用户在 IT 环境中的权限可能受到限制一样。除了将策略编程写入 AI 代理之外,企业还可以采用人机交互方法,即:由人类验证 AI 代理提供的答案是否准确或批准代理的行动。

通过数据飞轮学习

AI 代理也可以学习,利用过去行动的结果和人类用户的输入来完善其未来的行动。它们拥有“记忆”,不仅仅是指 RAM 的计算能力,还包括记住过去的交互和结果。通过一个称为“数据飞轮”的反馈循环进行这种学习:底层模型会利用代理的交互记录来改进未来的性能。

AI 代理有哪些类型?

AI 代理主要有两种类型:

  • 后台代理:它们在后台执行任务,尤其是日常任务,几乎不需要用户交互。后台代理就像门卫或维护人员一样,负责保持办公室清洁和照明正常。
  • 平面代理:它们更直接地与人类用户交互。聊天机器人、客户服务和 AI 助手都属于此类 AI 代理。平面代理就像办公大楼的前台工作人员,负责与走进大楼的人互动并根据需要完成某些任务。

还有单一代理和多个代理系统。单一代理 AI 系统仅基于一种模型构建。而个多代理 AI 系统组合了多个代理的功能,这些代理可以通过相互协商来解决问题。

什么是代理式 AI 聊天机器人?

像传统聊天机器人一样,代理式 AI 聊天机器人能够与人们进行对话交互。不过,代理式 AI 聊天机器人可以脱离自身环境(离开聊天环境),代表交互对象采取行动。传统聊天机器人也许能够提供关于提交支持工单的说明。代理式 AI 聊天机器人则能够自行提交工单。

代理式 AI 聊天机器人与非代理式 AI 聊天机器人

非代理式 AI 聊天机器人是被动响应,它们会根据训练数据来提供针对用户提示的答案。此类 AI 聊天机器人可能仍然由 LLM 提供支持,但与代表用户执行操作的代理式 AI 聊天机器人相比,它们更擅长为用户提供实用内容或指示。代理式 AI 聊天机器人能够在与用户交互的上下文之外执行操作,它们还可以从训练数据之外的各种来源进行学习。

Cloudflare 如何支持代理式 AI?

Cloudflare 开发人员平台会提供构建和部署 AI 代理所需的所有工具,以便这些代理可以:

  • 自主执行任务
  • 与客户实时沟通
  • 调用 AI 模型
  • 浏览 Web 内容
  • 查询数据库
  • 支持人机交互

此外,Cloudflare 全球网络让开发人员可以构建 AI 代理,在世界任何地方运行代码并尽可能靠近最终用户。了解如何开始在 Cloudflare 上构建 AI 代理