OpenAI开源Agents SDK:多智能体工作流到底有什么用?

OpenAI终于也坐不住了。

就在前几天,他们开源了官方的Agents SDK——一个轻量级的Python框架,专门用来构建多智能体工作流。名字很直白:openai-agents-python。

我看到这个消息的时候,第一反应是:这事儿挺有意思的。因为在这之前,如果你想用OpenAI的模型做多智能体,基本上得自己造轮子,或者用社区的各种第三方框架。现在官方下场,说明什么?说明他们意识到Agent这件事已经不是尝鲜阶段了,而是要认真推了。

说实话,我第一时间去翻了他们的GitHub仓库。代码写得挺干净的,文档也算详细。核心功能就几个:智能体定义、工具调用、多智能体编排、还有和OpenAI API的深度集成。

但问题是,这玩意儿到底有什么用?

我先说说我理解的多智能体场景。传统的单智能体,比如ChatGPT这种,就是一个大脑处理所有事情。但现实中很多任务其实是需要分工的——比如你要做一个自动化客服系统,可能需要有一个专门负责理解用户意图的智能体,一个负责查询订单信息的智能体,还有一个负责生成回复的智能体。

OpenAI的这个SDK,本质上就是让你能比较方便地把这些智能体串起来,定义它们之间的协作流程。

我试着写了个Demo,感觉上手门槛确实不高。定义一个Agent就是几行代码的事,然后你可以用内置的Runner来编排多个Agent的执行顺序。如果某个Agent处理不了,可以自动转交给其他Agent,这个机制设计得还算合理。

但我也发现了一些限制。首先,它目前只支持OpenAI自家的模型,虽然文档说未来可能会支持其他模型,但谁知道呢。其次,多智能体的调试其实挺麻烦的——当三个Agent串在一起工作的时候,出错了怎么定位问题?SDK提供了一些tracing功能,但用起来还是不够顺手。

还有一个问题是,这个SDK和LangChain、LlamaIndex这些成熟的Agent框架比起来,功能上还是单薄了一些。后两者已经形成了比较完整的生态,有大量的社区插件和集成。OpenAI现在入场,能不能后来居上,我觉得还不好说。

不过呢,官方出品有一个天然优势:和OpenAI API的深度优化。比如它内置了对函数调用的优化,对长上下文的处理也有一些专门的逻辑。如果你本来就是重度依赖OpenAI的开发者,用这个SDK确实能省不少事。

我个人觉得,这个SDK目前的定位更像是一个「轻量级选择」。如果你只是想做一两个简单的多智能体流程,不想引入LangChain那种重型框架,那它是个不错的选择。但如果你的场景很复杂,需要大量的自定义逻辑和第三方集成,可能还是得用更成熟的方案。

说到这儿,我想起了前几天看到的一个讨论。有人在问:现在做Agent开发,到底应该选哪个框架?我的观点是,没有银弹。轻量级的像OpenAI这个SDK,适合快速验证想法;重量级的像LangChain,适合构建生产级的复杂应用。关键是看你的场景和需求。

最后说说我的一个小观察。OpenAI这次开源Agents SDK,时机选得挺微妙的。就在Cursor融资20亿、Claude Code风头正劲的时候,他们放出这个消息。是不是有点「你们都在做Agent,我也不能落后」的意思?

Anyway,我已经把这个SDK加到今年的技术观察清单里了。接下来几个月看看社区反馈怎么样,如果生态能起来,可能会是个不错的工具。

你试用了这个SDK吗?感觉怎么样?