2026-05-10 AI 日报 · 叁笙早安 AI

今日头条

DeepSeek首轮融资500亿，梁

据The Information报道，DeepSeek筹备首轮外部融资，规模高达**500亿元人民币**（70亿美元）。创始人**梁文锋**拟亲自出资约**200亿元**，占融资总额近**40%**。阿里巴巴谈判已破裂，腾讯仍在洽谈中。

01 重点解读 4 篇

🔴 软银削减OpenAI股权质押贷款规模40%

未上市AI资产的估值溢价正在被资本市场重新定价。

软银将贷款目标从100亿美元砍至约60亿美元，根本原因不是软银缺钱，而是债权银行对OpenAI股权的流动性和可处置性存疑。非公开市场资产无法快速变现，一旦OpenAI估值波动，抵押品价值可能大幅缩水。这个信号对整个AI独角兽生态有示范效应：高估值不等于高信用，IPO前景不明确的公司，杠杆融资空间将持续收窄。

🔴 英伟达今年AI股权投资累计超400亿美元

NVIDIA正在从芯片供应商转型为AI生态的战略股东。

今年累计股权投资超400亿美元，覆盖AI基础设施全链条，同时与被投企业签商业合同——这意味着NVIDIA既是投资人又是客户，形成"资本绑定+采购锁定"的双重护城河。对比Microsoft通过Copilot生态绑定软件层，NVIDIA选择的是在算力层做同样的事。AI创业公司接受NVIDIA入股，换来的不只是钱，还有算力优先供应和市场背书，但也同时接受了更深的生态依赖。

🟡 xAI联创全退、Cursor团队进驻

马斯克正在把xAI从"AI研究机构"改造成"AI产品公司"。

11位联合创始人全部离场，Cursor团队接管核心业务，Colossus 1算力部分租给Anthropic——这三个动作同时发生，说明xAI的战略重心从底层研究转向应用交付。Cursor擅长的是IDE级AI辅助开发，进驻xAI意味着Grok可能会在代码能力和开发者工具方向加速。但人事动荡带来的组织风险不容忽视：原班创始团队的技术积累和文化认同，不是几周内可以交接的。

🟡 DeepSeek V4完整技术论文发布

FP4量化感知训练落地，DeepSeek在训练效率上再次押注激进路线。

完整版论文核心亮点是在后期训练阶段直接运行FP4 QAT，MoE专家权重以FP4精度存储，显存占用大幅下降。这不是推理侧的量化优化，而是训练侧的精度压缩——难度更高，也更有壁垒。对照Meta Llama系列仍以BF16为主流训练精度，DeepSeek这一选择若经过社区验证，将对下一代模型训练成本产生实质影响，值得工程团队跟进复现。 ---

02 今日速览 10 条

🔴 DeepSeek首轮融资500亿，梁文锋自掏

据The Information报道，DeepSeek筹备首轮外部融资，规模高达500亿元人民币（70亿美元）。创始人梁文锋拟亲自出资约200亿元，占融资总额近40%。阿里巴巴谈判已破裂，腾讯仍在洽谈中。

🔴 软银削减OpenAI股权质押贷款规模40%

软银将以OpenAI股份为抵押的保证金贷款目标从100亿美元下调40%至约60亿美元，反映债权人对未上市AI股权估值信心不足，资本市场对高估值、低透明度资产抵押趋于保守。

🔴 DeepSeek拒绝阿里入股，坚守独立路线

DeepSeek与阿里巴巴的融资谈判告吹，双方未能在具体条款上达成一致。DeepSeek选择优先维护公司独立性，避免深度绑定大厂生态，此举被业界视为中国AI创业公司争取话语权的信号。

🔴 英伟达今年AI股权投资累计超400亿美元

NVIDIA今年已在AI基础设施全链条公司累计押注超400亿美元股权投资，同时与被投企业签署商业合同，形成"资本+客户"双重绑定，进一步巩固其在AI供应链的核心地位。

🔴 DeepMind员工呼吁

Google DeepMind员工在X上公开呼吁：若AI公司真担心AGI对普通人的冲击，就应让公众有机会投资；否则，创造财富的同时拒绝分享，本质上是在为少数富豪服务。

🔴 字节跳动上调AI基础设施支出至2000亿元

据报道，字节跳动将今年AI基础设施支出计划提高25%至2000亿元人民币，主要驱动力来自内存芯片成本上涨及AI布局加速。这是中国互联网大厂中今年披露的最大规模AI基建预算之一。

🟡 YC掌门人开源AI开发框架，GitHub近10万星

Y Combinator现任CEO Garry Tan借助AI Agent以一人之力构建开源项目GStack，已在GitHub获近10万星。

🟡 xAI 11位联创全部离场，马斯克引入

马斯克旗下xAI的11位联合创始人已全部退出，Cursor员工进驻并主导核心业务重组；Colossus 1算力集群部分算力租给Anthropic。这场人事与业务双重换手，比外界预期更为彻底。

🟡 12GB显存跑Qwen3 35B达80

社区开发者使用最新llama.cpp配合MTP加速，在12GB显存显卡上实现Qwen3 35B模型80+ tok/秒生成速度，草稿接受率超80%，为消费级GPU本地大模型部署提供了新的参考配置。

🟡 DeepSeek V4技术论文完整版发布

DeepSeek V4完整版论文（较4月预览版大幅扩充）公开，核心亮点包括：在后期训练阶段直接进行FP4量化感知训练（QAT），MoE专家权重以FP4存储，大幅压缩显存占用，同时披露了多项训练稳定性技巧。

扫描 42 个信源 · 精选 10 条

DeepSeek创始人自掏腰包，首轮融资刷新中国AI纪录

DeepSeek首轮融资500亿，梁

🔴 软银削减OpenAI股权质押贷款规模40%

🔴 英伟达今年AI股权投资累计超400亿美元

🟡 xAI联创全退、Cursor团队进驻

🟡 DeepSeek V4完整技术论文发布