首页财产ai正文 GPT-5.4深夜发布,最合适OpenClaw的天选模子登场了 深夜GPT-5.4忽然发布,其代码能力强、世界常识富厚、能利用定阅额度且价格自制,还有有多项特征更新,作者火烧眉毛想于OpenClaw中利用。 2026-03-06 08:01 ·微信公家号:数字生命卡兹克数字生命卡兹克 AI投资人解读· GPT-5.4代码能力与GPT-5.3-Codex齐平,世界常识比GPT-5.2强,能利用定阅额度,价格仅Claude Opus 4.6一半;有100万token上下文窗口等特征更新。于多项跑分测试中体现精彩,如GDPval达83.0%。· 未说起行业竞争、政策变更等危害。总结:GPT-5.4上风凸起,机能及特征较优且价格合理,对于相干范畴有较高投资价值,值患上存眷其于现实运用中的体现和成长。内容由AI天生,仅供参考

深夜凌晨2点,我刚预备睡觉。

然后,GPT-5.4,忽然发布。

一会儿冲动的睡不着了。

真的,这真不是我每天咋咋呼呼啥的,我真的也很少会用冲动的睡不着觉这类表述。

这是由于,我一直于等正式版的GPT-5.3或者者GPT-5.4,来作为我的OpenClaw的*模子。

理由尤其简朴,由于现代世界三十年,素质上下层都是代码,咱们此刻看到的关在计较机及互联网的一切,险些都成立于代码的基础之上。

以是你可以理解为,代码能力,于许多时辰,就代表着Agent能力的一根粗壮的腿。

一个优异的Agent基座模子,于我的理解里,一般来讲,需要三种都很强:

代码能力、世界常识、多模态理解。

当你这三个都能SOTA的时辰,你险些一定就是最牛逼的Agent模子,固然,还有有一个主要的因素,就是价格。

于已往,Claude Opus 4.6,险些就是Agent模子的代名词,由于代码、世界常识都很强,多模态能力虽然比不外Seed 2.0及Gemini 3.1 Pro,可是于一些场景内里,也够了,由于此刻的Agent,跟实际物理交互还有没有那末多,阿谁已经经是具身智能的领域了。

而我已往很喜欢的GPT-5.3-Codex,代码能力确凿强,于做使命履行的时辰,那的确就是指哪打哪。

可是*的问题,这玩意是一个编程特化模子啊,世界常识就是一坨屎,连GPT-5.2都不如,以是OpenAI其时也是没措施,为了跟Claude打一打,只能加个Codex的后缀给放出来了。

以是你会发明,于计划能力上,是彻底比不外Claude Opus 4.6的,可是*的问题,实在还有是由于世界常识的问题,就致使这玩意。

它说天书,讲的那些话,真的,我不是步伐员身世,我看阿谁话,看的就真的超等费劲。

就好比说,我让他以前对于我的一个AI热门网站的项目举行审查,重要就是review一下我的文档规范及我整个代码库。

然后,这哥们写的文档,我尼玛。。。

你再对于比一下Claude Opus 4.6写的。

对于比起来应该一目明了。。。

就是由于这玩意不说人话,世界常识也不行,以是,只是于Codex内里用用还有好,可是你要是把它接到你的OpenClaw内里,去当成默许模子,你就知道啥叫灾害了,这哥们险些没有人味,提及话来我想揍他。

以是我其时试了一下,就直接弃了,还有是于我的OpenClaw内里,用的Claude Opus 4.6及Sonnet 4.6,做了一下场景挪用。

那为啥说,我很期待GPT-5.4呢。

由于,Claude哪都好,可是,它贵啊!!!

它真的好贵啊!!!!!!

并且由于Anthropic这个呆逼,它把OpenClaw给疯了,以是我定阅的Claude的Max Plan的额度,是彻底不克不及给OpenClaw用的,只能于Claude Code用,你想于OpenClaw上用,只能硬接API Key用。

可是各人都知道,Claude的API有多贵,那底子不是咱们这类穷逼团队能用的起的,小范围用用还有好,年夜范围用那公司直接停业了。

以前还有有一条路是用反代,把Google家的Antigravity内里的Claude额度用插件代办署理出来,扔给OpenClaw用。

可是后面Google最先多量量封号,致使也没措施用了。

我过年的时辰Google账号还有被封了,被迫用AI去给Google写了一份痛哭流涕的邮件。

我说我错了,我不再会了。

后面Google才给我解封,可是反代必定是用不明晰。

而OpenAI就纷歧样了,最最先Claude疯狂封OpenCode账号的时辰,OpenAI年夜手一挥,就站了出来,说咱们不封,各人全力利用。

图片

这是御三家里,*一个这么撑持立场的,可以用第三方的东西,挪用Codex的额度的。

那对于OpenClaw天然也不破例了,也是几个*模子内里,为数未几的,可以直接走登录的,其他的都患上用API。

真的,OpenAI这会真的是年夜善人。

还有疯狂的给Codex加额度。

图片

以是啊,Claude于OpenClaw里用,好是好,可是不克不及用定阅额度,只能用API,贵的一笔。

OpenAI的模子却是可以用定阅额度,可是GPT-5.2代码又不行,GPT-5.3-codex又不说人话。

你看,要多别扭有多别扭。

而这一次,GPT-5.4来了!!!

终究把这个短板给补上了!

代码能力跟GPT-5.3-Codex齐平,世界常识比GPT-5.2还有要强,还有能利用定阅额度,20刀就能够用的超等爽。

你就说,这不是最合适OpenClaw的天选模子,还有有谁是?嗯?

从今天最先,用OpenClaw的,都把默许模子切换到GPT-5.4去,真的,信我。

回到GPT-5.4,老例子,先看跑分。

就很爽。

先看最要害的几个。

GDPval:83.0%

这个是测AI于真实事情使命中体现的,包括金融、法令等44种职业的常识事情。

GPT-5.4 Thinking拿了83.0%,Claude Opus 4.6是78.0%,GPT-5.3 Codex是70.9%。

于真实营业场景里,GPT-5.4不只是会写代码,它还有能跟你聊营业、聊金融、聊法令、聊各类专业范畴的工具。

并且是用人话聊,不是用天书聊。

SWE-Bench Pro:57.7%

这个是测AI解决真实软件工程问题的,不只是Python,而是测四种编程语言。

GPT-5.4 Thinking拿了57.7%,GPT-5.3 Codex是56.8%。

基本持平。

这就是我最想看到的成果。

代码能力保住了GPT-5.3 Codex的程度,世界常识又补上来了。

OSWorld-Verified也是,75.0%。这个是测AI操作电脑的能力的,就是让AI像人同样,用鼠标点击、用键盘输入、于差别运用之间切换,完成各类使命。

GPT-5.4 Thinking拿了75.0%,跨越了Claude Opus 4.6的72.7%,也连结了跟GPT-5.3-Codex的持平。

并且,GPT-5.4操作电脑的速率,快的离谱。

看下这个没有加快过的视频,会更直不雅。

ToolAthon:54.6%

这个是测AI利用东西的能力的,也就是Agent能力的焦点指标之一。

GPT-5.4 Thinking拿了54.6%,Claude Sonnet 4.6是44.8%。

差了快要10个点。

至在学术常识之类的,跟GPT-5.3-codex就无法比了,由于OpenAI本身也知道,以是,直接其时就没跑。

总之,翻译成明白话就是。

GPT-5.4 = GPT-5.3 Codex的代码能力 + 比GPT-5.2还有强的世界常识 + 更强的东西利用能力 + 超等自制的codex额度。

这四样加于一路,就是一个*的OpenClaw天选基座模子。

然后还有有几个很棒的特征更新:

1. 100万token的上下文窗口。

这是GPT-5.4的一个年夜进级。

以前GPT-5.3的上下文窗口是40万token,GPT-5.4直接翻了一倍多,到了100万。

这对于Agent来讲过重要了。

由于Agent于履行使命的时辰,需要连结对于整个使命的上下文理解。假如上下文窗口不敷年夜,Agent干着干着就会忘事儿,前面说的工具后面就不记患了。

100万token,基本上充足应答绝年夜部门的Agent使命了。

固然,OpenAI也不傻,他们说,跨越27万token以后,你的额度就算两倍了。

不外由于Codex给的额度其实是太多太多了,以是纵然是2倍,实在也还有好。

2. 原生计较机利用能力。

这个是GPT-5.4的另外一个年夜卖点。

OpenAI说,GPT-5.4是他们*个内置原生计较机利用能力的主线模子。

它于编写经由过程Playwright等库操作计较机的代码方面体现很是的精彩,同时也能按照屏幕截图发出鼠标及键盘号令。

也就是代码及视觉齐飞,我觉得,这个小龙虾接入之后,就真的可以,直接用视觉,操控你电脑上绝年夜大都的软件了,真的,原生操控,想一想都冲动。

他们基在此,还有发布了一个新的skills,叫playwright-interactive。

答应Codex同时以代码及视觉的两种方式,调试Web及Electron运用。

网址于此,各人可以自行安装。

https://github.com/openai/skills/tree/main/skills/.curated/playwright-interactive

3. 撑持了东西搜刮。

之前呢,当模子被付与东西时,所有东西界说城市预先包罗于提醒中。

对于在拥有年夜量东西的体系,这可能会为每一个哀求增长数千甚至数万个token,并且绝年夜大都的时辰,都毫无心义,无缘无故的致使成本上升、相应变慢,并于上下文中满盈模子可能永远不会利用的信息。

以是呢,此次他们也撑持了东西搜刮,就是GPT‑5.4再也不直接吸收完备东西界说,而是吸收一份可用东西的轻量列表以和东西搜刮功效。

当模子需要利用某个东西时,它可以查找该东西的界说并于其时将其追加到对于话中。

就很是像Skills渐进式出现的方式,目的很简朴,还有是优化上下文工程。

OpenAI于本身测试完之后,发明东西搜刮配置于连结不异正确率的同时将整体token利用量削减47%,这个就很是牛逼了。

GPT-5.4 Thinking年夜概就是如许。

此次他们实在还有发了个GPT-5.4 Pro,我就不细说了,横竖就是一切都更牛逼了,可是对于在年夜大都人来讲,太贵了,也没啥年夜用,必需患上200刀的Pro会员才能用。

API的总体价格还有是患上说一下,虽然各人年夜几率用的城市是定阅的额度。

比拟在GPT-5.2,价格是涨了的,可是还有是比Claude Opus 4.6,自制不少,Claude Opus 4.6的价格是美金5/美金25每一百万token(输入/输出),GPT-5.4只有他们一半。

今朝ChatGPT已经经上线了。

Codex也已经经撑持了,我本身于Codex内里粗浅体验了一下。

起首扑面而来的,那天然是清爽沁人的人话。。。

好比我让它去把OpenAI官网的视频给扒拉下来,你看看这个讲话:“这类活最烦”,“省的跟Cloudflare互相折寿”。。。

还有有这个。

真的,Codex的输出,我真的能看患上懂了。。。

做出来的工具,前端审美有了不错的前进,但还有是不如Opus 4.6及Gemini。

写作大略测了一下,还有是一股子稀里糊涂的爱用排比句的诡异的味道。

奇希奇怪。

然后有点惋惜的就是,我比及了凌晨6点多,OpenClaw今朝利用Codex登录的方式,还有是没有撑持GPT-5.4。

这就致使,我还有是没有时机测GPT-5.4于小龙虾上的效果。

不外预计我一觉睡醒,预计小龙虾就撑持了。

由于社区里已经经看到许多用户于催了,并且先行官们,都遍及反馈效果很好。

坐等撑持,我真的已经经火烧眉毛了。

又是开心的一晚。

假如你也于用OpenClaw,那记患上OpenClaw撑持了之后,把默许模子切换到GPT-5.4。

假如你还有没用过OpenClaw,那正好,此刻是一个很好的最先机会。

究竟,有了GPT-5.4这个天选模子,体验只会更好。

2026年,真是疯狂的一年啊。

睡了。

【本文由投资界互助伙伴微信公家号:数字生命卡兹克授权发布,本平台仅提供信息存储办事。】若有任何疑难,请接洽(editor@zero2ipo.com.cn)投资界处置惩罚。

-lehu乐虎88国际