AI Agent 的关键所在

AI Agent 的未来将由结果决定,而非抽象概念。本文旨在呼吁大家关注真正重要的事情。这才是我们应该真正讨论的内容。

What Matters in AI Agents

喧嚣

AI Agent 领域发展迅速。新框架。新产品。新范式。新理念。

随之而来的,自然是喧嚣。

在过去的几个月里,关于什么才是一个“真正”的 Agent 框架,出现了大量的博客文章、对比评测和热门评论。声明式 vs 命令式。图 vs 循环。抽象 vs 控制。

其中有些是经过深思熟虑的。很多只是表演性的。所有这些都有偏见——包括我们自己。

但重点是:当互联网还在争论语法树和编排模型时,开发者们正在努力交付产品。开发者们正在连接各种工具。开发者们正在将原型推向生产环境。

团队正在扪心自问:在关键时刻,我们能相信这个系统吗?
这才是我们关心的对话。

不是哪个框架在下一场推特大战中获胜——而是哪个框架真正能帮助用户完成任务。

事实

用户不关心框架。
他们关心的是系统能为他们做什么。

无论你是利用周末时间搭建个人项目的独立开发者,还是在各业务单元推广 AI 的企业架构师——价值才是目标。

不是功能清单。
不是抽象的纯粹性。
也不是某物是“工作流”还是“Agent”。

只是

  • 它能解决问题吗?
  • 我能相信它正常运行吗?
  • 我能在它之上顺畅地构建吗?
每个人都能做更多事情,例如在物流方面 [感谢 CrewAI Enterprise],我们可以在 10 分钟内实现一个承运商接入,这以前需要 5 天 [...] 我们对这个 Agent 未来将把我们带向何方感到非常兴奋。[Gelato 案例研究]

Steven
Gelato 公司产品副总裁


我们很容易陷入内部细节。
但从用户的角度来看,那些都是实现细节。
归根结底,价值取胜。每次都是如此。

陷阱

在快速发展的生态系统中,很容易被各种功能所吸引——把它们并排放置,好像这样就能解决所有问题一样。

但过于关注表面能力可能会让你陷入一个陷阱:将表面复杂性误认为是真实能力

优秀的工程实践从未改变。我们依然会问

  • 能用的最简单版本是什么?
  • 单一事实来源在哪里?
  • 如何使它易于维护和审计?
  • 我至少需要做到什么程度?

诸如 KISS (保持简单直观)组合优于继承SOLID (设计原则) 等原则——它们对 Agent 的适用性,就像它们对 Web 应用和 API 一样重要。

重点不是要构建更复杂的 Agent
重点是构建更好的系统——可靠、可组合、可观测且易于调试的系统。

所以当我们看到纯粹从内部机制来解读框架时——命令式 vs 声明式,图 vs 循环,抽象 vs 编排——区别在于

你们谈论的是工具
我们思考的是系统

机会

这个时刻的妙处在于,我们仍处于早期阶段。
模式仍在形成。最佳实践仍在书写中。
这意味着还有试验和分歧的空间。

我们之前说过:构建 Agent 系统没有唯一正确的方法。

有些团队将受益于高度结构化的流程。
另一些团队则倾向于自主 Agent。
大多数团队会同时使用两者——相互交织、动态组合、共同创造价值。 (我们称之为 CrewAI Flows)

这不是问题。这是进步。
这个领域不需要更多的教条。
它需要能给用户提供选择的框架——而不是强迫他们站队。
它需要能够互操作的生态系统,能够组合的工具,以及能够适应团队现有基础的系统。

更多灵活性。更多控制力。更少意识形态。更多价值。

过去我们使用 RPA 来执行某些任务,现在我们希望利用 CrewAI Agents 来完成这些任务 [...]

我们看到该产品在过去一年中变得越来越成熟 [...] [IBM 案例研究]

Narayanan Alavandar
杰出工程师 & 首席架构师
IBM Consulting

真正的工作

构建 AI Agent 的难点不在于在图和循环之间做选择。
也不在于你的编排语法是否足够声明式。

难点在于围绕 LLM 发生的一切

  • 确保它在正确的步骤拥有正确的上下文
  • 优雅地处理故障超时边缘情况
  • 添加可观测性,以便调试、审计和改进。
  • 构建确保安全的护栏
  • 在现实场景需要时,支持人工参与的工作流。
  • 确保你的系统与现有技术栈具备互操作性
  • 为团队提供所需的治理和可见性,以便在快速迭代的同时不失控

当你超越原型阶段时,这些事情才是关键。
这就是区分“演示中能跑”和“能在生产环境运行”的关键。

在我带有偏见的看来,这就是 CrewAI 及其企业套件的价值所在——它提供的不是理论,而是旨在处理复杂性、让你专注于结果的工具。

将 CrewAI Agent 引入工作流后,我们的代码生成准确率从大约 10% 提高到了 70% 以上。[普华永道案例研究]

Jacob Wilson
普华永道商业生成式 AI 首席技术官

CrewAI 的方式

在 CrewAI,我们并非为了赢得框架辩论而出发。

我们着手构建的是我们自己想要使用的平台——一个能够从周末项目扩展到关键任务系统的平台。

这就是为什么我们构建了一个将多 Agent 协作 (crews) 与事件驱动编排 (flows) 相结合的系统,以及为什么我们在我们的 CrewAI 企业版产品 上围绕它构建了一个完整的技术栈。
在这里,Agent 和 Flows 并非相互排斥——而是清晰、可组合地协同工作。
在这里,你可以从简单开始,逐步变得复杂,并且永远不会觉得被自己的工具所束缚。

我们相信抽象是强大的——只要它们不碍事。

这不是关于简单的演示或炫目的基准测试。
这是关于构建能够持久运行的系统。

我们仍处于 AI Agent 的早期阶段。

思想仍在演进。工具正在成熟。标准尚未固定。这是一份礼物——因为它意味着我们有机会把它做好。

不是通过争论抽象概念。也不是通过争取成为最“正确”的那一方。
而是通过构建能工作的系统。通过互相帮助,更快、更好、更安全地交付产品。

我们为在 CrewAI 构建的一切感到自豪。

为我们的用户——开源贡献者、独立开发者和企业团队——感到自豪,是他们展示了 Agent 在生产环境中的潜力。
而我们才刚刚开始。

所以,致所有在这个领域努力构建的人们

继续前进。继续交付。保持对价值的关注。
真正的工作不在我们身后——而是在前方。