lehu乐虎88国际-GPT

首页财产ai正文 GPT-5.4深夜发布，最合适OpenClaw的天选模子登场了深夜GPT-5.4忽然发布，其代码能力强、世界常识富厚、能利用定阅额度且价格自制，还有有多项特征更新，作者火烧眉毛想于OpenClaw中利用。 2026-03-06 08:01 ·微信公家号：数字生命卡兹克数字生命卡兹克 AI投资人解读· GPT-5.4代码能力与GPT-5.3-Codex齐平，世界常识比GPT-5.2强，能利用定阅额度，价格仅Claude Opus 4.6一半；有100万token上下文窗口等特征更新。于多项跑分测试中体现精彩，如GDPval达83.0%。· 未说起行业竞争、政策变更等危害。总结：GPT-5.4上风凸起，机能及特征较优且价格合理，对于相干范畴有较高投资价值，值患上存眷其于现实运用中的体现和成长。内容由AI天生，仅供参考

深夜凌晨2点，我刚预备睡觉。

然后，GPT-5.4，忽然发布。

一会儿冲动的睡不着了。

真的，这真不是我每天咋咋呼呼啥的，我真的也很少会用冲动的睡不着觉这类表述。

这是由于，我一直于等正式版的GPT-5.3或者者GPT-5.4，来作为我的OpenClaw的*模子。

理由尤其简朴，由于现代世界三十年，素质上下层都是代码，咱们此刻看到的关在计较机及互联网的一切，险些都成立于代码的基础之上。

以是你可以理解为，代码能力，于许多时辰，就代表着Agent能力的一根粗壮的腿。

一个优异的Agent基座模子，于我的理解里，一般来讲，需要三种都很强：

代码能力、世界常识、多模态理解。

当你这三个都能SOTA的时辰，你险些一定就是最牛逼的Agent模子，固然，还有有一个主要的因素，就是价格。

于已往，Claude Opus 4.6，险些就是Agent模子的代名词，由于代码、世界常识都很强，多模态能力虽然比不外Seed 2.0及Gemini 3.1 Pro，可是于一些场景内里，也够了，由于此刻的Agent，跟实际物理交互还有没有那末多，阿谁已经经是具身智能的领域了。

而我已往很喜欢的GPT-5.3-Codex，代码能力确凿强，于做使命履行的时辰，那的确就是指哪打哪。

可是*的问题，这玩意是一个编程特化模子啊，世界常识就是一坨屎，连GPT-5.2都不如，以是OpenAI其时也是没措施，为了跟Claude打一打，只能加个Codex的后缀给放出来了。

以是你会发明，于计划能力上，是彻底比不外Claude Opus 4.6的，可是*的问题，实在还有是由于世界常识的问题，就致使这玩意。

它说天书，讲的那些话，真的，我不是步伐员身世，我看阿谁话，看的就真的超等费劲。

就好比说，我让他以前对于我的一个AI热门网站的项目举行审查，重要就是review一下我的文档规范及我整个代码库。

然后，这哥们写的文档，我尼玛。。。

你再对于比一下Claude Opus 4.6写的。

对于比起来应该一目明了。。。

就是由于这玩意不说人话，世界常识也不行，以是，只是于Codex内里用用还有好，可是你要是把它接到你的OpenClaw内里，去当成默许模子，你就知道啥叫灾害了，这哥们险些没有人味，提及话来我想揍他。

以是我其时试了一下，就直接弃了，还有是于我的OpenClaw内里，用的Claude Opus 4.6及Sonnet 4.6，做了一下场景挪用。

那为啥说，我很期待GPT-5.4呢。

由于，Claude哪都好，可是，它贵啊！！！

它真的好贵啊！！！！！！

并且由于Anthropic这个呆逼，它把OpenClaw给疯了，以是我定阅的Claude的Max Plan的额度，是彻底不克不及给OpenClaw用的，只能于Claude Code用，你想于OpenClaw上用，只能硬接API Key用。

可是各人都知道，Claude的API有多贵，那底子不是咱们这类穷逼团队能用的起的，小范围用用还有好，年夜范围用那公司直接停业了。

以前还有有一条路是用反代，把Google家的Antigravity内里的Claude额度用插件代办署理出来，扔给OpenClaw用。

可是后面Google最先多量量封号，致使也没措施用了。

我过年的时辰Google账号还有被封了，被迫用AI去给Google写了一份痛哭流涕的邮件。

我说我错了，我不再会了。

后面Google才给我解封，可是反代必定是用不明晰。

而OpenAI就纷歧样了，最最先Claude疯狂封OpenCode账号的时辰，OpenAI年夜手一挥，就站了出来，说咱们不封，各人全力利用。

这是御三家里，*一个这么撑持立场的，可以用第三方的东西，挪用Codex的额度的。

那对于OpenClaw天然也不破例了，也是几个*模子内里，为数未几的，可以直接走登录的，其他的都患上用API。

真的，OpenAI这会真的是年夜善人。

还有疯狂的给Codex加额度。

以是啊，Claude于OpenClaw里用，好是好，可是不克不及用定阅额度，只能用API，贵的一笔。

OpenAI的模子却是可以用定阅额度，可是GPT-5.2代码又不行，GPT-5.3-codex又不说人话。

你看，要多别扭有多别扭。

而这一次，GPT-5.4来了！！！

终究把这个短板给补上了！

代码能力跟GPT-5.3-Codex齐平，世界常识比GPT-5.2还有要强，还有能利用定阅额度，20刀就能够用的超等爽。

你就说，这不是最合适OpenClaw的天选模子，还有有谁是？嗯？

从今天最先，用OpenClaw的，都把默许模子切换到GPT-5.4去，真的，信我。

回到GPT-5.4，老例子，先看跑分。

就很爽。

先看最要害的几个。

GDPval：83.0%

这个是测AI于真实事情使命中体现的，包括金融、法令等44种职业的常识事情。

GPT-5.4 Thinking拿了83.0%，Claude Opus 4.6是78.0%，GPT-5.3 Codex是70.9%。

于真实营业场景里，GPT-5.4不只是会写代码，它还有能跟你聊营业、聊金融、聊法令、聊各类专业范畴的工具。

并且是用人话聊，不是用天书聊。

SWE-Bench Pro：57.7%

这个是测AI解决真实软件工程问题的，不只是Python，而是测四种编程语言。

GPT-5.4 Thinking拿了57.7%，GPT-5.3 Codex是56.8%。

基本持平。

这就是我最想看到的成果。

代码能力保住了GPT-5.3 Codex的程度，世界常识又补上来了。

OSWorld-Verified也是，75.0%。这个是测AI操作电脑的能力的，就是让AI像人同样，用鼠标点击、用键盘输入、于差别运用之间切换，完成各类使命。

GPT-5.4 Thinking拿了75.0%，跨越了Claude Opus 4.6的72.7%，也连结了跟GPT-5.3-Codex的持平。

并且，GPT-5.4操作电脑的速率，快的离谱。

看下这个没有加快过的视频，会更直不雅。

ToolAthon：54.6%

这个是测AI利用东西的能力的，也就是Agent能力的焦点指标之一。

GPT-5.4 Thinking拿了54.6%，Claude Sonnet 4.6是44.8%。

差了快要10个点。

至在学术常识之类的，跟GPT-5.3-codex就无法比了，由于OpenAI本身也知道，以是，直接其时就没跑。

总之，翻译成明白话就是。

GPT-5.4 = GPT-5.3 Codex的代码能力 + 比GPT-5.2还有强的世界常识 + 更强的东西利用能力 + 超等自制的codex额度。

这四样加于一路，就是一个*的OpenClaw天选基座模子。

然后还有有几个很棒的特征更新：

1. 100万token的上下文窗口。

这是GPT-5.4的一个年夜进级。

以前GPT-5.3的上下文窗口是40万token，GPT-5.4直接翻了一倍多，到了100万。

这对于Agent来讲过重要了。

由于Agent于履行使命的时辰，需要连结对于整个使命的上下文理解。假如上下文窗口不敷年夜，Agent干着干着就会忘事儿，前面说的工具后面就不记患了。

100万token，基本上充足应答绝年夜部门的Agent使命了。

固然，OpenAI也不傻，他们说，跨越27万token以后，你的额度就算两倍了。

不外由于Codex给的额度其实是太多太多了，以是纵然是2倍，实在也还有好。

2. 原生计较机利用能力。

这个是GPT-5.4的另外一个年夜卖点。

OpenAI说，GPT-5.4是他们*个内置原生计较机利用能力的主线模子。

它于编写经由过程Playwright等库操作计较机的代码方面体现很是的精彩，同时也能按照屏幕截图发出鼠标及键盘号令。

也就是代码及视觉齐飞，我觉得，这个小龙虾接入之后，就真的可以，直接用视觉，操控你电脑上绝年夜大都的软件了，真的，原生操控，想一想都冲动。

他们基在此，还有发布了一个新的skills，叫playwright-interactive。

答应Codex同时以代码及视觉的两种方式，调试Web及Electron运用。

网址于此，各人可以自行安装。

https://github.com/openai/skills/tree/main/skills/.curated/playwright-interactive

3. 撑持了东西搜刮。

之前呢，当模子被付与东西时，所有东西界说城市预先包罗于提醒中。

对于在拥有年夜量东西的体系，这可能会为每一个哀求增长数千甚至数万个token，并且绝年夜大都的时辰，都毫无心义，无缘无故的致使成本上升、相应变慢，并于上下文中满盈模子可能永远不会利用的信息。

以是呢，此次他们也撑持了东西搜刮，就是GPT‑5.4再也不直接吸收完备东西界说，而是吸收一份可用东西的轻量列表以和东西搜刮功效。

当模子需要利用某个东西时，它可以查找该东西的界说并于其时将其追加到对于话中。

就很是像Skills渐进式出现的方式，目的很简朴，还有是优化上下文工程。

OpenAI于本身测试完之后，发明东西搜刮配置于连结不异正确率的同时将整体token利用量削减47%，这个就很是牛逼了。

GPT-5.4 Thinking年夜概就是如许。

此次他们实在还有发了个GPT-5.4 Pro，我就不细说了，横竖就是一切都更牛逼了，可是对于在年夜大都人来讲，太贵了，也没啥年夜用，必需患上200刀的Pro会员才能用。

API的总体价格还有是患上说一下，虽然各人年夜几率用的城市是定阅的额度。

比拟在GPT-5.2，价格是涨了的，可是还有是比Claude Opus 4.6，自制不少，Claude Opus 4.6的价格是美金5/美金25每一百万token（输入/输出），GPT-5.4只有他们一半。

今朝ChatGPT已经经上线了。

Codex也已经经撑持了，我本身于Codex内里粗浅体验了一下。

起首扑面而来的，那天然是清爽沁人的人话。。。

好比我让它去把OpenAI官网的视频给扒拉下来，你看看这个讲话：“这类活最烦”，“省的跟Cloudflare互相折寿”。。。

还有有这个。

真的，Codex的输出，我真的能看患上懂了。。。

做出来的工具，前端审美有了不错的前进，但还有是不如Opus 4.6及Gemini。

写作大略测了一下，还有是一股子稀里糊涂的爱用排比句的诡异的味道。

奇希奇怪。

然后有点惋惜的就是，我比及了凌晨6点多，OpenClaw今朝利用Codex登录的方式，还有是没有撑持GPT-5.4。

这就致使，我还有是没有时机测GPT-5.4于小龙虾上的效果。

不外预计我一觉睡醒，预计小龙虾就撑持了。

由于社区里已经经看到许多用户于催了，并且先行官们，都遍及反馈效果很好。

坐等撑持，我真的已经经火烧眉毛了。

又是开心的一晚。

假如你也于用OpenClaw，那记患上OpenClaw撑持了之后，把默许模子切换到GPT-5.4。

假如你还有没用过OpenClaw，那正好，此刻是一个很好的最先机会。

究竟，有了GPT-5.4这个天选模子，体验只会更好。

2026年，真是疯狂的一年啊。

睡了。

【本文由投资界互助伙伴微信公家号：数字生命卡兹克授权发布，本平台仅提供信息存储办事。】若有任何疑难，请接洽（editor@zero2ipo.com.cn）投资界处置惩罚。

-lehu乐虎88国际

回到上一页