叁笙早安 AI
VOL.2026.06.05 · 10 条 · AI 晨报

国产推理模型 Nex-N2-Pro 叫板 GPT-5.5

2026 年 6 月 5 日 · 星期五 · 每日清晨 AI 精选
今日头条

Nex-N2-Pro 发布

neolab 推出 **Nex-N2-Pro**,基于 **Qwen3.5** 的 MoE 模型,对标 **GPT-5.5**、省 **30-50%** 思考 token。**这意味着** 国产开源推理已贴第一梯队。

今日深度· 国产推理模型 Nex-N2-Pro 叫板 GPT-5.5

事实

neolab 发布 Nex-N2-Pro,基于 Qwen3.5-397B 的 MoE 推理模型,支持 262K 上下文。官方称性能达 GPT-5.5 级别,在 SWE-Verified 取 SOTA。可自动调推理深度,省 30-50% 思考 token。

判断

对比海外,GPT-5.5 与 Claude Opus 4.7 仍是闭源标杆,Nex-N2-Pro 走 Qwen 开源底座加垂直优化路线。它兼容 Claude Code、Cursor,半年内若在真实 Agent 任务稳住 SOTA,迁移成本将倒逼闭源降价。

启示

行业冲击:开源模型省一半推理成本还贴闭源性能,按 token 计费的模式首当其冲,GPT-5.5 API 溢价被收窄。读者动作:盯紧两条曲线--一是 SWE-Verified 任务稳定性,二是免费期后定价。谁先跑通低成本高推理,谁就率先卡位智能体编码。

01 重点解读 4 篇
01

🔴 OpenAI CFO 详解战略:抢 IPO 第一没意义

OpenAI 把自己当电网,不当聊天机器人

CFO Sarah Friar 反复强调"选择权"--IPO 只是融资工具,1220 亿美元($122B) 融资是为锁定 2030-2032 年算力,而非冲刺上市。ChatGPT 周活破 9 亿,B 端 C 端收入五五开。她从单云单芯片转向 Oracle、CoreWeave、AWS 多方协同,把数千亿资本开支转成运营成本。对手盯着"谁先上市",她盯着谁能提前数年锁死基础设施。

02

🔴 Anthropic 公开押注递归自我改进

Anthropic 把"AI 造 AI"摆上了台面

新博客称已接近一个能 自主设计并建造继任者 的 AI,关键词是 acceleration。它同时强调这尚未到来、也非必然,但可能比多数机构准备好的时间更早。这种"既加速又预警"的双面表态,正是 Anthropic 一贯的安全叙事。值得警惕的是,一旦递归自我改进成真,模型迭代速度将脱离人类评审节奏,治理窗口被大幅压缩。

03

🔴 微软幻灯片疑泄 Claude Mythos 算力

一张幻灯片把万亿模型的算力底牌掀了

新智元报道,微软材料疑似泄露 Claude Mythos 训练用 6.1×10²⁷ FLOPs,与 Gemini 3.1 Pro 同档。2023 年业界还在争 10²⁶ 是否理性极限,2026 年 10²⁷ 已成头部标配。算力即门槛,这个数字意味着没有数万张顶级卡的玩家,连入场训练前沿模型的资格都在快速消失。

04

🔴 MiniMax M3 冲上开源第一引争议

同一个模型,墙内墙外两种声音

MiniMax M3 登顶开源榜,Vercel CEO Guillermo Rauch(540 万粉) 罕见站台力荐。但国内社区因 Token Plan 涨价、老用户权益缩水吵翻,海外则有人质疑它 工业级蒸馏 Claude。国产模型出海拿到顶级背书是好事,可定价策略与原创性争议若处理不好,会反噬来之不易的口碑。后续就看 MiniMax 如何回应这两条质疑。

02 今日速览 10 条
01
🔴 Nex-N2-Pro 发布
neolab 推出 Nex-N2-Pro,基于 Qwen3.5 的 MoE 模型,对标 GPT-5.5、省 30-50% 思考 token。这意味着 国产开源推理已贴第一梯队。
02
🔴 OpenAI CFO 详解战略
CFO Sarah Friar 披露:B 端 C 端五五开,ChatGPT 周活破 9 亿,3 月融 1220 亿美元 锁算力而非上市。对开发者,多云多芯片意味着议价空间变大。
03
🔴 Anthropic 公开押注递归自我改进
KOL kimmonismus 转述 Anthropic 新博客:公司称已接近能 自主设计并建造继任者 的 AI,但强调尚未到来。这意味着 AI 安全治理窗口正被压缩。
04
🔴 企业 AI Agent 上线前信任认证
arXiv 新论文提出 部署前保障:用本体论驱动仿真加信任认证,补上跑分到生产落地的空白。对企业 来说,这给 Agent 进生产线立了一道可量化准入门槛。
05
🔴 纯 Rust 写 1-bit 大模型引擎
开发者绕开 PyTorch、CUDA,用纯 Rust 手写 1-bit 推理引擎,边缘 CPU 150+ TPS、内存 350MB这意味着 无显卡设备跑大模型门槛再降。
06
🔴 英伟达开源 Nemotron-3-Ultra
NVIDIA 上架 Nemotron-3-Ultra-550B,激活 55B,Mamba-2+MoE 混合架构、上下文 1M对开发者 而言,自建百万级窗口应用成本明显下探。
07
🔴 微软幻灯片疑泄 Claude Mythos 算力
微软材料疑泄 Claude Mythos 训练算力达 6.1×10²⁷ FLOPs,与 Gemini 3.1 Pro 同档。这意味着 头部模型已进 10²⁷ 算力时代。
08
🔴 谷歌 AI Edge Gallery 登陆 Mac
谷歌 AI Edge Gallery 上 macOS,16GB 内存即可离线跑 12B 多模态,首批含 Gemma-4-12B-it对用户 Mac 端侧生产力门槛又降一截。
09
🔴 MiniMax M3 冲上开源第一引争议
MiniMax M3 登顶开源榜,Vercel CEO Rauch 罕见站台。国内因涨价吵翻,海外质疑其蒸馏 Claude。这意味着 国产开源认可与定价的拉扯公开化。
10
🟡 腾讯算生态宁德算电表:DeepSeek 融资
DeepSeek 首轮约 70 亿美元 估值最高 590 亿美元,腾讯拟投 100 亿、梁文锋自掏 200 亿。腾讯元宝月活仅 5735 万这意味着 自研领先也要买入场券。
扫描 69 个信源 · 精选 10 条