AI 代理是一种由人工智能提供支持的计算机程序,可以代表人类用户自主执行复杂的任务。
阅读本文后,您将能够:
复制文章链接
AI 代理是一种由人工智能 (AI) 提供支持的计算机程序,即使没有明确的指令,它也可以自主执行任务来协助人类用户。不同于聊天机器人等其他基于 AI 的软件,AI 代理可以在基于特定提示的上下文之外运行。可以这么说,它们能够脱离训练数据并环顾整个世界来查找信息,然后根据这些信息自主采取行动,以实现更大的目标。
AI 代理可以做出决策,从过去的经验中学习,并相应地调整行动。它们甚至可以咨询其他 AI 代理来获取相关信息。人类负责为 AI 代理设定目标,而代理的职责是弄清楚如何实现这些目标。它们可以独立运行,或者只需极少的人工干预就能运行。
AI 代理可以为硬件提供支持(机器人技术)或仅在软件中运行。
AI 代理就是前文所述的软件程序:它们能够自主决策并处理任务。代理式 AI 是 AI 开发领域,它支持构建 AI 代理。(想一想生成式 AI 与个别大型语言模型(例如 Microsoft Copilot)之间的区别,或者想一想“烹饪”与具体菜肴之间的区别。)
生成式 AI (GenAI) 是指一种深度学习模型,它可以根据提示来生成内容。ChatGPT 等 LLM 都属于这类 AI。代理式 AI 则建立在 GenAI 基础之上。LLM 只能通过特定用户界面或 API 对提示做出回复,而 AI 代理则可以超越既定的上下文,甚至在没有提示的情况下也可以执行操作。
大公司的销售主管可能会这样提示大型语言模型 (LLM) 说:“请帮我写一封电子邮件,让我可以发送给我司的 10 个最大客户,邀请他/她们来参加晚宴。”但如果使用代理式 AI,该主管可能会提示 AI 代理说:“请邀请我司的 10 个最大客户来参加晚宴”。换句话说,LLM 可以生成文本,AI 代理则应该能够生成电子邮件文本、在 CRM 中找到排名前 10 的客户,以及发送个性化电子邮件来邀请客户参加活动(前提条件是它拥有足够的权限这样做)。
AI 代理基于 LLM 而构建。LLM 是一种经过大量样本数据训练的 AI 模型,能够理解人类创建的内容并生成自己的内容。LLM 甚至可以理解不确切的人类提示和请求。
由于 AI 代理基于 LLM 构建,因此,它们可以处理并解读从用户的对话请求到 Web 托管的视频内容等各种数据和内容。AI 代理可以解读来自多种媒体类型的内容,包括:代码、文本、音频、视频等等。然后,他们就可以利用从这些内容中了解到的内容来优化行动。
此外,AI 代理具备与世界互动的方式。在机器人技术中,这可能包括物理传感器和摄像头。对于纯软件 AI 代理,这可能有几种形式:
这些与 AI 代理环境之外的世界进行交互的方式,让 AI 代理能够采取行动。企业可以制定 AI 代理的防护措施,以帮助确保它们采取的行动正确无误,就像人类用户在 IT 环境中的权限可能受到限制一样。除了将策略编程写入 AI 代理之外,企业还可以采用人机交互方法,即:由人类验证 AI 代理提供的答案是否准确或批准代理的行动。
AI 代理也可以学习,利用过去行动的结果和人类用户的输入来完善其未来的行动。它们拥有“记忆”,不仅仅是指 RAM 的计算能力,还包括记住过去的交互和结果。通过一个称为“数据飞轮”的反馈循环进行这种学习:底层模型会利用代理的交互记录来改进未来的性能。
AI 代理主要有两种类型:
还有单一代理和多个代理系统。单一代理 AI 系统仅基于一种模型构建。而个多代理 AI 系统组合了多个代理的功能,这些代理可以通过相互协商来解决问题。
像传统聊天机器人一样,代理式 AI 聊天机器人能够与人们进行对话交互。不过,代理式 AI 聊天机器人可以脱离自身环境(离开聊天环境),代表交互对象采取行动。传统聊天机器人也许能够提供关于提交支持工单的说明。代理式 AI 聊天机器人则能够自行提交工单。
非代理式 AI 聊天机器人是被动响应,它们会根据训练数据来提供针对用户提示的答案。此类 AI 聊天机器人可能仍然由 LLM 提供支持,但与代表用户执行操作的代理式 AI 聊天机器人相比,它们更擅长为用户提供实用内容或指示。代理式 AI 聊天机器人能够在与用户交互的上下文之外执行操作,它们还可以从训练数据之外的各种来源进行学习。
Cloudflare 开发人员平台会提供构建和部署 AI 代理所需的所有工具,以便这些代理可以:
此外,Cloudflare 全球网络让开发人员可以构建 AI 代理,在世界任何地方运行代码并尽可能靠近最终用户。了解如何开始在 Cloudflare 上构建 AI 代理。
入门
人工智能
机器学习
大数据
词汇