叁笙早安 AI
VOL.2026.05.10 · 10 条 · AI 晨报

DeepSeek创始人自掏腰包,首轮融资刷新中国AI纪录

2026 年 5 月 10 日 · 星期日 · 每日清晨 AI 精选
今日头条

DeepSeek首轮融资500亿,梁

据The Information报道,DeepSeek筹备首轮外部融资,规模高达**500亿元人民币**(70亿美元)。创始人**梁文锋**拟亲自出资约**200亿元**,占融资总额近**40%**。阿里巴巴谈判已破裂,腾讯仍在洽谈中。

01 重点解读 4 篇
01

🔴 软银削减OpenAI股权质押贷款规模40%

未上市AI资产的估值溢价正在被资本市场重新定价。

软银将贷款目标从100亿美元砍至约60亿美元,根本原因不是软银缺钱,而是债权银行对OpenAI股权的流动性和可处置性存疑。非公开市场资产无法快速变现,一旦OpenAI估值波动,抵押品价值可能大幅缩水。这个信号对整个AI独角兽生态有示范效应:高估值不等于高信用,IPO前景不明确的公司,杠杆融资空间将持续收窄。

02

🔴 英伟达今年AI股权投资累计超400亿美元

NVIDIA正在从芯片供应商转型为AI生态的战略股东。

今年累计股权投资超400亿美元,覆盖AI基础设施全链条,同时与被投企业签商业合同——这意味着NVIDIA既是投资人又是客户,形成"资本绑定+采购锁定"的双重护城河。对比Microsoft通过Copilot生态绑定软件层,NVIDIA选择的是在算力层做同样的事。AI创业公司接受NVIDIA入股,换来的不只是钱,还有算力优先供应和市场背书,但也同时接受了更深的生态依赖。

03

🟡 xAI联创全退、Cursor团队进驻

马斯克正在把xAI从"AI研究机构"改造成"AI产品公司"。

11位联合创始人全部离场,Cursor团队接管核心业务,Colossus 1算力部分租给Anthropic——这三个动作同时发生,说明xAI的战略重心从底层研究转向应用交付。Cursor擅长的是IDE级AI辅助开发,进驻xAI意味着Grok可能会在代码能力和开发者工具方向加速。但人事动荡带来的组织风险不容忽视:原班创始团队的技术积累和文化认同,不是几周内可以交接的。

04

🟡 DeepSeek V4完整技术论文发布

FP4量化感知训练落地,DeepSeek在训练效率上再次押注激进路线。

完整版论文核心亮点是在后期训练阶段直接运行FP4 QAT,MoE专家权重以FP4精度存储,显存占用大幅下降。这不是推理侧的量化优化,而是训练侧的精度压缩——难度更高,也更有壁垒。对照Meta Llama系列仍以BF16为主流训练精度,DeepSeek这一选择若经过社区验证,将对下一代模型训练成本产生实质影响,值得工程团队跟进复现。 ---

02 今日速览 10 条
01
🔴 DeepSeek首轮融资500亿,梁文锋自掏
据The Information报道,DeepSeek筹备首轮外部融资,规模高达500亿元人民币(70亿美元)。创始人梁文锋拟亲自出资约200亿元,占融资总额近40%。阿里巴巴谈判已破裂,腾讯仍在洽谈中。
02
🔴 软银削减OpenAI股权质押贷款规模40%
软银将以OpenAI股份为抵押的保证金贷款目标从100亿美元下调40%至约60亿美元,反映债权人对未上市AI股权估值信心不足,资本市场对高估值、低透明度资产抵押趋于保守。
03
🔴 DeepSeek拒绝阿里入股,坚守独立路线
DeepSeek与阿里巴巴的融资谈判告吹,双方未能在具体条款上达成一致。DeepSeek选择优先维护公司独立性,避免深度绑定大厂生态,此举被业界视为中国AI创业公司争取话语权的信号。
04
🔴 英伟达今年AI股权投资累计超400亿美元
NVIDIA今年已在AI基础设施全链条公司累计押注超400亿美元股权投资,同时与被投企业签署商业合同,形成"资本+客户"双重绑定,进一步巩固其在AI供应链的核心地位。
05
🔴 DeepMind员工呼吁
Google DeepMind员工在X上公开呼吁:若AI公司真担心AGI对普通人的冲击,就应让公众有机会投资;否则,创造财富的同时拒绝分享,本质上是在为少数富豪服务。
06
🔴 字节跳动上调AI基础设施支出至2000亿元
据报道,字节跳动将今年AI基础设施支出计划提高25%2000亿元人民币,主要驱动力来自内存芯片成本上涨及AI布局加速。这是中国互联网大厂中今年披露的最大规模AI基建预算之一。
07
🟡 YC掌门人开源AI开发框架,GitHub近10万星
Y Combinator现任CEO Garry Tan借助AI Agent以一人之力构建开源项目GStack,已在GitHub获近10万星。
08
🟡 xAI 11位联创全部离场,马斯克引入
马斯克旗下xAI的11位联合创始人已全部退出,Cursor员工进驻并主导核心业务重组;Colossus 1算力集群部分算力租给Anthropic。这场人事与业务双重换手,比外界预期更为彻底。
09
🟡 12GB显存跑Qwen3 35B达80
社区开发者使用最新llama.cpp配合MTP加速,在12GB显存显卡上实现Qwen3 35B模型80+ tok/秒生成速度,草稿接受率超80%,为消费级GPU本地大模型部署提供了新的参考配置。
10
🟡 DeepSeek V4技术论文完整版发布
DeepSeek V4完整版论文(较4月预览版大幅扩充)公开,核心亮点包括:在后期训练阶段直接进行FP4量化感知训练(QAT),MoE专家权重以FP4存储,大幅压缩显存占用,同时披露了多项训练稳定性技巧。
扫描 42 个信源 · 精选 10 条