2026-06-05 AI 日报 · 叁笙早安 AI

今日头条

Nex-N2-Pro 发布

neolab 推出 **Nex-N2-Pro**，基于 **Qwen3.5** 的 MoE 模型，对标 **GPT-5.5**、省 **30-50%** 思考 token。**这意味着** 国产开源推理已贴第一梯队。

今日深度· 国产推理模型 Nex-N2-Pro 叫板 GPT-5.5

事实

neolab 发布 Nex-N2-Pro，基于 Qwen3.5-397B 的 MoE 推理模型，支持 262K 上下文。官方称性能达 GPT-5.5 级别，在 SWE-Verified 取 SOTA。可自动调推理深度，省 30-50% 思考 token。

判断

对比海外，GPT-5.5 与 Claude Opus 4.7 仍是闭源标杆，Nex-N2-Pro 走 Qwen 开源底座加垂直优化路线。它兼容 Claude Code、Cursor，半年内若在真实 Agent 任务稳住 SOTA，迁移成本将倒逼闭源降价。

启示

行业冲击：开源模型省一半推理成本还贴闭源性能，按 token 计费的模式首当其冲，GPT-5.5 API 溢价被收窄。读者动作：盯紧两条曲线--一是 SWE-Verified 任务稳定性，二是免费期后定价。谁先跑通低成本高推理，谁就率先卡位智能体编码。

01 重点解读 4 篇

🔴 OpenAI CFO 详解战略：抢 IPO 第一没意义

OpenAI 把自己当电网,不当聊天机器人

CFO Sarah Friar 反复强调"选择权"--IPO 只是融资工具,1220 亿美元（$122B） 融资是为锁定 2030-2032 年算力,而非冲刺上市。ChatGPT 周活破 9 亿,B 端 C 端收入五五开。她从单云单芯片转向 Oracle、CoreWeave、AWS 多方协同,把数千亿资本开支转成运营成本。对手盯着"谁先上市",她盯着谁能提前数年锁死基础设施。

🔴 Anthropic 公开押注递归自我改进

Anthropic 把"AI 造 AI"摆上了台面

新博客称已接近一个能 自主设计并建造继任者 的 AI,关键词是 acceleration。它同时强调这尚未到来、也非必然,但可能比多数机构准备好的时间更早。这种"既加速又预警"的双面表态,正是 Anthropic 一贯的安全叙事。值得警惕的是,一旦递归自我改进成真,模型迭代速度将脱离人类评审节奏,治理窗口被大幅压缩。

🔴 微软幻灯片疑泄 Claude Mythos 算力

一张幻灯片把万亿模型的算力底牌掀了

新智元报道,微软材料疑似泄露 Claude Mythos 训练用 6.1×10²⁷ FLOPs,与 Gemini 3.1 Pro 同档。2023 年业界还在争 10²⁶ 是否理性极限,2026 年 10²⁷ 已成头部标配。算力即门槛,这个数字意味着没有数万张顶级卡的玩家,连入场训练前沿模型的资格都在快速消失。

🔴 MiniMax M3 冲上开源第一引争议

同一个模型,墙内墙外两种声音

MiniMax M3 登顶开源榜,Vercel CEO Guillermo Rauch（540 万粉） 罕见站台力荐。但国内社区因 Token Plan 涨价、老用户权益缩水吵翻,海外则有人质疑它 工业级蒸馏 Claude。国产模型出海拿到顶级背书是好事,可定价策略与原创性争议若处理不好,会反噬来之不易的口碑。后续就看 MiniMax 如何回应这两条质疑。

02 今日速览 10 条

🔴 Nex-N2-Pro 发布

neolab 推出 Nex-N2-Pro，基于 Qwen3.5 的 MoE 模型，对标 GPT-5.5、省 30-50% 思考 token。这意味着 国产开源推理已贴第一梯队。

🔴 OpenAI CFO 详解战略

CFO Sarah Friar 披露：B 端 C 端五五开，ChatGPT 周活破 9 亿，3 月融 1220 亿美元 锁算力而非上市。对开发者，多云多芯片意味着议价空间变大。

🔴 Anthropic 公开押注递归自我改进

KOL kimmonismus 转述 Anthropic 新博客：公司称已接近能 自主设计并建造继任者 的 AI，但强调尚未到来。这意味着 AI 安全治理窗口正被压缩。

🔴 企业 AI Agent 上线前信任认证

arXiv 新论文提出 部署前保障：用本体论驱动仿真加信任认证，补上跑分到生产落地的空白。对企业 来说，这给 Agent 进生产线立了一道可量化准入门槛。

🔴 纯 Rust 写 1-bit 大模型引擎

开发者绕开 PyTorch、CUDA，用纯 Rust 手写 1-bit 推理引擎，边缘 CPU 150+ TPS、内存 350MB。这意味着 无显卡设备跑大模型门槛再降。

🔴 英伟达开源 Nemotron-3-Ultra

NVIDIA 上架 Nemotron-3-Ultra-550B，激活 55B，Mamba-2+MoE 混合架构、上下文 1M。对开发者 而言，自建百万级窗口应用成本明显下探。

🔴 微软幻灯片疑泄 Claude Mythos 算力

微软材料疑泄 Claude Mythos 训练算力达 6.1×10²⁷ FLOPs，与 Gemini 3.1 Pro 同档。这意味着 头部模型已进 10²⁷ 算力时代。

🔴 谷歌 AI Edge Gallery 登陆 Mac

谷歌 AI Edge Gallery 上 macOS，16GB 内存即可离线跑 12B 多模态，首批含 Gemma-4-12B-it。对用户 Mac 端侧生产力门槛又降一截。

🔴 MiniMax M3 冲上开源第一引争议

MiniMax M3 登顶开源榜，Vercel CEO Rauch 罕见站台。国内因涨价吵翻，海外质疑其蒸馏 Claude。这意味着 国产开源认可与定价的拉扯公开化。

🟡 腾讯算生态宁德算电表：DeepSeek 融资

DeepSeek 首轮约 70 亿美元 估值最高 590 亿美元，腾讯拟投 100 亿、梁文锋自掏 200 亿。腾讯元宝月活仅 5735 万，这意味着 自研领先也要买入场券。

扫描 69 个信源 · 精选 10 条