首页财产ai正文 Codex不筹算让Claude Code好于 2月6日OpenAI总裁设3月31日为刻日,要求工程师用agent。六周内Codex七次庞大动作,用户及口碑升,开发者利用模式变,冲刺未竣事。 2026-03-14 11:59 ·硅星人周一笑 AI投资人解读· OpenAI的Codex六周内七次庞大产物动作,周活用户自年头增加超三倍,利用量增加5倍。其经由过程自身编写年夜部门代码、立异工程构造与审查机制,从东西走向体系。 · 行业竞争激烈,如Anthropic的Claude Code已经做出可不雅年化收入;技能成长快,模子能力晋升迅速,需不停迭代产物。 总结:Codex成长势头强劲,于与Claude Code的竞争中依附工程体系上风脱颖而出,但面对激烈竞争与技能迭代挑战,后续成长值患上存眷。内容由AI天生,仅供参考

2月6日,OpenAI总裁Greg Brockman于X上公然发了一条面向全公司工程团队的帖子,设了一个deadline:到3月31日,任何技能使命,工程师的*东西应该是agent,而不是编纂器或者终端。

这是OpenAI对于本身下的带动令。

假如只看这句话,你可能会感觉又是一条硅谷式的愿景声明。但接下来六周发生的工作注解,Brockman不是于喊标语。OpenAI的Coding Agent平台Codex,正于履历一轮稀有的产物冲刺,密度之高,节拍之快,甚至让一些持久存眷AI编码东西的开发者最先从头审阅本身的东西链。

与此同时,Codex于步伐员群体中的热度及口碑也于肉眼可见识上升。

一切动作都指向“偷袭”Anthropic 如日中天的Claude Code。

六周的疯狂迭代

拉一下时间线就能感触感染到这个节拍。

2月2日,Codex桌面App发布(macOS),OpenAI同时公布向ChatGPT免费及Go用户开放Codex,所有付用度户的速度限定翻倍。

2月5日,GPT-5.3-Codex发布,OpenAI称它为"*个帮忙创造了自身的模子"。统一天,Anthropic发布Claude Opus 4.6。

2月12日,Codex-Spark发布,与AI推理硬件公司Cerebras互助,推理速率跨越每一秒1000 tokens。OpenAI的说法是,“当模子能力愈来愈强,交互速率就成为了明确的瓶颈。”

2月14日,OpenClaw开创人Peter Steinberger公布插手OpenAI。据Pragmatic Engineer报导,Steinberger用Codex编写了OpenClaw的全数代码,偏好永劫间运行的agentic loop。Sam Altman于X上称他为“天才”,说他将“鞭策下一代personal agents”。

3月4日,Codex桌面App登岸Windows。

3月5日,GPT-5.4发布,是OpenAI*个同时具有reasoning、coding及原生computer use能力的通用模子,于Codex及API中撑持100万token上下文。

3月6日,Codex Security进入research preview。这是OpenAI推出的运用安全代办署理,前身为内测阶段的Aardvark,可以或许阐发代码堆栈、构建项目级威逼模子、于沙盒中验证缝隙并提出修复建议。已往30天的beta测试中,它扫描了跨越120万次co妹妹its,发明792个critical级别缝隙及跨越10000个高危问题,笼罩OpenSSH、GnuTLS、Chromium等重量级开源项目。误报率降低跨越50%,噪音降低84%。

利用数据也于同步爬升。Sam Altman于X上确认,Codex的周活用户自年头以来增加跨越三倍;Codex团队卖力人Thibault Sottiaux(Tibo)告诉Pragmatic Engineer的Gergely Orosz,1月以来它的利用量增加了5倍,周活开发者跨越100万。Tibo还有于播客中提到,Super Bowl周日播出的Codex告白让体系险些当即蒙受了巨年夜负载。

六周,七次庞大产物动作,这成为了OpenAI于产物上最激进的冲刺之一。

要理解这个节拍,一方面要看供应侧的变化。GPT-5系列模子的agent能力于已往几个月呈现了质的奔腾,从上下文窗口、东西挪用到永劫间自立履行,模子自己的能力到了一个可以支撑Coding Agent这个产物形态的临界点。

另外一方面,需求侧的旌旗灯号一样强烈。据SemiAnalysis报导,Anthropic的Claude Code已经经做出25亿美元的年化收入,占其企业收入的一半以上。Claude Code用真金白银证实了Coding Agent可以成为AI公司的焦点收入引擎。对于在估值据报已经达数千亿美元的OpenAI来讲,抛却这个赛道不是一个实际的选项。

根据SemiAnalysis的预测AnthropicARR增速一度超过OpenAI

按照SemiAnalysis的猜测AnthropicARR增速一度跨越OpenAI

时间点上的贴身格斗也值患上留意。GPT-5.3-Codex及Claude Opus 4.6于2月5日统一天发布。Codex Security及Claude Code Security险些同期推出。这类节拍自己就是旌旗灯号,两家公司正于把Coding Agent平台视为正面疆场。

开发者最先从Claude Code的单一模式酿成混淆模式

于很长一段时间,Anthropic旗下的Claude Code看起来好像已经经没有了敌手,用户对于它的依靠变患上愈来愈重。而OpenAI显然不想让Anthropic 这么惬意。于Codex的一通激进冲刺后,开发者社区的反映也最先发生一些变化。

已往一个月,Reddit及Hacker News上关在Codex及Claude Code的会商,呈现频率最高的词不是更好或者替换,而是stacking。也就是说,愈来愈多的开发者不是于二者之间选择,而是同时利用。

Calvin French-Owen是一个典型案例。他是Segment结合开创人,曾经于OpenAI介入Codex web产物的发布,同时也是Claude Code的深度用户。他于本年2月写的一篇博客里说,本身选择东西的焦点尺度是“我有几多时间,以和我想让它多自立地跑”。

他的一样平常事情流是用Claude Code做计划、编排终端及治理git操作,然后切到Codex做现实编码。他说Opus于跨上下文窗口的事情中效率更高,会同时启动多个子代办署理并行摸索代码库;而Codex于永劫间自立编码使命上更不变。

Reddit上也呈现了更详细的分工模式。有开发者具体描写了一个五段式workflow,先让Claude Code出规划,再让Codex review规划,然后由Claude实行,末了交给Codex做code review及QA迭代。还有有人直接把Claude Code及Codex串成为了一个CLI bridge,由于手动于二者之间复制粘贴太累了。

一篇社区别析总结了500多条Reddit评论后的结论,Claude Code于一组小样本盲测中胜率到达67%,质量更高;但Codex 20美元的套餐能编码一成天不停,而Claude Code同价位十几个prompt就用完了。“Claude Code质量更高但用不完,Codex稍弱但全天能用”,这是2026年3月开发者社区最真正的共鸣。

在Cursor官方的benchmark中,GPT系列整体*其他模型。

于Cursor官方的benchmark中,GPT系列总体*其他模子。

开发者社区还有传播着一个比方来描写二者的气质差异,Claude像美国人,合适做布满创造力的摸索及脑筋风暴,Codex像德国人,代表*的效率及专注履行。“它就像一条咬住骨头不放的狗,很是顽强,会一直测验考试直到解决问题。”

固然也有背面声音。Hacker News上有开发者说Codex对于本身来讲“每一一项都比Claude Code差”,特别是code review会制造看似合理但现实不存于的问题,他末了只把Codex用来复核Claude的产出。

但年夜标的目的已经经很明确了,社区会商正于从哪一个更好就用哪一个,酿成两个都用,各占一个工位。

比的再也不是benchmark,是谁是更实用的产物

只看模子benchmark,你不太轻易理解Codex为何起势。于SWE-Bench这种编码评测上,Claude Opus 4.6仍旧*。真正让Codex拉开差异之处于别处,OpenAI正于缭绕它构建一整套工程体系。

Orosz本年2月发表了一篇对于Codex团队的深度报导。此中最惹人注目的事实是,Codex跨越90%的代码是由Codex本身编写的。Anthropic方面也有近似的说法,Claude Code的创立者Boris Cherny告诉Orosz,Claude Code的数据年夜致相称。

固然,这里的90%需要打个扣头理解,于一个成熟项目中,样板代码、测试用例、通例重构占了年夜量行数,焦点架构决议计划仍旧由人来做。但两家AI试验室都于用本身的coding 东西来编写本身的coding 东西,这类自举自己就申明了这些东西已经经深度嵌入了一样平常工程流程。

Codex 的基本工作原理

Codex 的基本事情道理

Codex团队于工程构造层面走患上更远。Orosz的报导描写了一种新的事情方式,Codex团队的典型工程师同时运行4到8个并行agent,别离处置惩罚feature开发、code review、安全审计、代码库理解、bug修复等使命。工程师的脚色正于从写代码的人酿成治理agent的人。

技能选型上,Codex CLI选择了Rust(Claude Code利用的是TypeScript)。团队卖力人Tibo给出的理由不仅是机能及准确性,还有有工程文化,选择Rust是为了给团队设定一个高工程尺度,同时削减对于npm依靠生态的依靠。他们甚至招募了Rust终端UI库Ratatui的维护者全职插手团队。

更值患上存眷的是分层代码审查机制。Codex团队练习了一个定制的code review模子,据Tibo说约9/10的评论能指出有用问题。审查分两层,非要害代码于AI review后可以直接merge,焦点agent代码及开源组件仍旧要求强迫人工审查。这套机制的意义于在,审查自己最先分层了。

还有有两个细节能申明Codex正于从东西走向体系。Codex可以运行本身的完备测试套件来测试自身;团队还有设置了夜间巡检,让Codex主动扫描代码库并天生待审修复建议,工程师天天早长进公司时就有一批修复等着review。

一家名为Wonderful的AI开发公司的首席架构师于本年3月写了一篇文章,描写了他们四个月前禁止手动coding后的经验。他对于两个东西的定位是,Codex是坐于房间后面戴耳机的工程师,默默读完你整个代码库15分钟才写*行代码,Claude则更有产物感,更擅长判定甚么觉得对于。他们把Codex用在低延迟体系事情、及时语音管线、机能敏感代码,Claude则用在UI及前端。

从coding东西到Agent平台

拉远来看,Codex六周冲刺的标的目的指向一个更年夜的野心。

Peter Steinberger的插手是一小我私家事旌旗灯号。改日常同时并行5到10个agent,插手OpenAI后的标的目的是下一代personal agents,不是coding东西。OpenAI正于用Codex作为agent战略的进口。

Codex Security则是另外一个标的目的的延长。当Codex从帮你写代码走向帮你审计安全,它的定位就已经经变了。

GPT-5.4进一步加快了这个改变。作为OpenAI*个具有原生computer use能力的通用模子,它于Codex中不仅能写代码,还有能操作电脑、跨运用履行事情流。共同正于成型的插件/skills生态体系及企业级权限治理,Codex的轮廓愈来愈像一个AI原生的开发平台。

Codex团队于Every的播客中吐露了他们眼中的下一个瓶颈,就是代码审查。

模子天生代码的速率已经经远超人类review的速率,验证产出的准确性成为了最紧急的问题。他们已经经于测验考试让模子经由过程重现用户操作路径来“证实”修复有用,而不是让人类逐行读代码。

这些野心及Claude Code已经经愈来愈清晰的成长标的目的有许多重合,于从Claude Code那里迅速抢走了一些用户及利用场景以后,Codex的势头正于起来。回到Greg Brockman 2月6日的那条帖子。他设的deadline是3月31日,今朝间隔deadline还有有两周多,而从已往六周的节拍来看,Codex的冲刺还有远没有竣事。

OpenAI把曾经经于模子上出现出的狠劲儿及卷王的气质,都放到了Codex上,接下来它及Claude code之间短兵相接的故事,会更出色了。

【本文由投资界互助伙伴硅星人授权发布,本平台仅提供信息存储办事。】若有任何疑难,请接洽(editor@zero2ipo.com.cn)投资界处置惩罚。

-lehu乐虎88国际