AI代理不是LLM / 聊天机器人

简介

聊天机器人已经过时,单靠大型语言模型是不够的——未来属于真正的人工智能代理,它们结合理解、推理和行动,能够自主完成跨越现实世界系统的复杂任务。

AI 代理不是 LLM / 聊天机器人

一年后,世界将以类似于记忆传真机的方式来记住聊天机器人:这是通往更好事物的一个尴尬步骤。问任何首席运营官关于他们的聊天机器人推广,你会看到相同的礼貌耸肩:“它很笨重,维护成本高,回答常见问题时常失败。我们仍然需要人类。” 我们都经历过这种情况。你试图调整一个重要包裹的送货时间或地址。一个聊天机器人礼貌地回复说它已经记录了你的请求,并将让人工客服来处理物流。但它没有采取其他任何行动。你感到沮丧。 现实是:聊天机器人时代已经结束。那些仍然坚持使用它的企业将浪费时间、金钱和人才。一种新型的自主 AI 代理正在崛起,而这两种方法之间的鸿沟将决定哪些公司快速前进,哪些公司则陷入客户服务的炼狱。

我们为何被僵尸聊天机器人所困 早期的聊天机器人本应是自动化的前线。然而,它们却成为了人人最不喜欢的客户体验。为什么?因为它们从未被构建来理解任何东西。 它们从一开始就是基于规则的。硬编码脚本,线性决策树,“如果这样,那么那样”的流程迅速变得复杂。说出完全正确的短语,它们就会回应。即使稍有偏差,你要么被忽视,要么被循环回到开始。就像一个更有礼貌的IVR菜单。指数级的分支使得传统聊天机器人在超过20个常见用例后变得无法维护,更不用说提供投资回报了。 问题不仅仅是糟糕的用户体验——它是架构性的问题。基于规则的系统无法泛化。它们只能对预定义的输入和场景作出反应。只要有任何变化——政策更新、新的定价层级、客户稍微以不同方式提问的有效问题——整个流程就会崩溃。 接下来会发生什么?升级到人类。一次又一次。 与此同时,前线工作人员被困在执行机器人无法完成的重复任务中——手动更新运输记录、打电话给司机、记录更新——而仪表板却报告“成功互动”。这到底是为谁工作? 今天,大多数企业“AI 聊天机器人”的部署仅仅是华丽的决策树。表面的改进 — 更友好的语气、品牌化的头像 — 无法改变基本现实:它们脆弱、浅薄,容易卡住。 但这些机器人被视为灵丹妙药。因此,公司不断投资,希望每次新发布都能最终解决问题。但没有。它不可能。因为这一架构从来没有为自主理解或行动而构建——它是为了转移工单而构建的。 这就是为什么大多数聊天机器人关键绩效指标都是表面的:客户满意度、交接率、会话长度。当你问:“它真的解决了问题吗?”仪表盘就安静了。 当你庆祝聊天机器人指标时,实际上是在庆祝一个用于行驶距离的跑步机。简单来说:很多运动,却没有目的地。

然后是LLM——说话者,而非行动者 GPT及其同类出现了。突然间,机器人能够进行对话。它们理解俚语。它们处理模糊性。它们记住事情,并拥有较长的上下文记忆。 这感觉就像魔法。它确实是一次飞跃。第一次,人工智能能够大规模生成类人响应。人工智能是智能的。 但这里有个问题:大型语言模型是出色的即兴表演者,而不是操作者。 他们没有结构化的目标。他们不知道何时任务完成。他们无法在没有支架的情况下可靠地访问、更新或执行业务规则。他们所产生的是语言——引人注目、表达清晰,并且偶尔有用,但很少有责任感。 当一个大型语言模型告诉你它已经提交了你的请求时,其实并没有。除非它被包装在一个将语言与行动连接起来的 orchestration 层中,否则它仍然只是空谈。 因此,尽管大语言模型推动了行业的发展,但它们并没有解决执行差距。它们创造了一种新的虚假期望。现在,用户不仅对机器人感到沮丧——他们对听起来聪明但实际上无法提供帮助的人工智能感到困惑。 这种困惑引导我们来到这里:人工智能工作流和人工智能代理。

什么是真正的AI代理 AI工作流是一个执行具有预定步骤的命令的LLM。但在现实世界中,步骤往往无法提前预测。 这就是人工智能代理的作用。它是一个与外部工具集成的大型语言模型,能够进行深入推理,并且——利用它所能访问的一切——解决那些人类需要花费数个数量级更长时间才能完成的复杂问题。 AI代理通过结合所有三个层面来实现这一目标。 首先,一个对话层,通常是一个大型语言模型(LLM),用于解释意图(是的,LLM确实有用,只是默认将LLM称为“人工智能解决方案”就像把拨号调制解调器称为WiFi);其次,一个推理层,概述了所有决定应该发生什么的规则、政策和任务规划;第三,执行层与CRM、ERP、支付通道、语音系统及任何隐藏在壁橱里的遗留系统安全连接。 去掉任何一层,塔就会倒塌。将它们保持在一起,系统就从“回复”转变为“解决”。 让我们重新审视一下需要重新派送包裹的客户场景。 传统上,聊天机器人可以完成第一步——工单处理。大型语言模型可能让你更进一步。然后需要人类介入。他们做出决策,然后手动输入回复。这是痛苦的。现在,AI代理主动执行整个工作流程,做出自主决策,与后台系统交互,并记录活动以供审计,除非绝对必要,否则无需人工干预。

*图片来源:*Jurin AI

代理在三十秒内完成了本会在多个部门之间来回传递的工作。它从头到尾负责这个任务。

所以让我们停止将一切称为“代理”

“AI代理”这个词正处于风口浪尖——但就像所有好的流行词,它的含义正在被稀释。每个拥有聊天机器人和API的供应商现在都声称提供“代理”。有些甚至仅仅因为他们的LLM能记住你的名字五轮就使用这个词。

这种误用不仅仅是品牌宣传的空话——它造成了真正的混淆。它让买家期望工具能提供从未设计出来的结果。这通过创造虚假的期望来减缓采用速度,最终导致真正的失望。最糟糕的是,它让企业自我安慰以为自己在创新,实际上他们只是将一个新的用户界面附加到同样的旧服务台上。

但人工智能的转型是真实的。 真正的人工智能代理不仅仅是更具对话性。它们更具责任感。它们深度整合,负责任地行动,并提供可追溯的、对业务至关重要的结果。它们不仅仅是一个界面——它们是基础设施。

而我们仅仅处于开始阶段。


信息的未来:从应用程序到人工智能代理 多年来,我们一直在适应机器的逻辑。我们点击菜单,记住界面, juggling五个标签页只为完成一项任务。搜索变得更加智能,应用程序变得更加简洁——但负担仍然在用户身上。

人工智能代理翻转这个。

系统不是要求你学习如何运作,而是通过自然对话学习你的工作方式。

想要预订旅行吗?只需与您的私人人工智能礼宾聊天: “计划一次在阿尔卑斯山的徒步旅行,早九月,避开人迹罕至的地方。” 这就是发生的事情。航班、酒店、当地向导——甚至是你自己绝对无法发现的隐藏宝藏。没有90年代的网站或糟糕用户体验的笨重移动应用。只有一个能让事情顺利进行的对话。

这是一种从您操作的应用程序转变为代表您操作的代理的方式。

而这还不仅仅是旅行。代理将重新塑造我们与一切的互动——物流、采购、合规、人力资源。悄然地用能够推理、行动并随着时间的推移而不断改进的智能系统,转变脆弱的工具和碎片化的工作流程。

这是代理未来:任务通过理解、行动和交付的人工智能即时完成,无论是通过语音还是文本——您专属的执行助理。

这不是一个科幻愿景。它距离我们只有一到两年的时间。而我们已经在Jurin AI朝这个方向努力建设。

自主AI时代已经到来,我们仅仅触及了表面。我从未如此兴奋。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate APP
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)