VOL.2026.04.25 · 0 条 · AI 晨报
DeepSeek V4 开源:效率驱动降价,1M 上下文成标配
2026 年 4 月 25 日 · 周六 · 每日清晨 AI 精选
今日头条
GPT-5.5 与 DeepSeek V4 同日登场,价差百倍;Google 400亿押注 Anthropic;Tim Cook 确认9月卸任
今日深度· DeepSeek V4 开源:效率驱动降价,1M 上下文成标配
事实
2026 年 4 月 24 日,深度求索发布 DeepSeek-V4 预览版,MIT 协议开源,比 GPT-5.5 晚约 24 小时。两档:V4-Pro(总参 1.6T,激活 49B,权重 865GB)和 V4-Flash(总参 284B,激活 13B),全系 1M token 上下文,Thinking/Non-Thinking 双模式。API 定价:V4-Flash 输出 $0.28/M,V4-Pro 输出 $3.48/M——后者是当前最便宜的旗舰级开放 API,GPT-5.5 输出价格($30/M)是其 8.6 倍。 低价来源是效率提升:CSA(压缩稀疏注意力)+HCA 混合机制,Engram 模块将长上下文知识卸载至 CPU 内存,绕开 GPU HBM 带宽瓶颈。官方报告:1M token 场景下 V4-Pro 推理 FLOPs 仅为 V3.2 的 27%,KV 缓存 10%;V4-Flash 更低至 FLOPs 10%、KV 缓存 7%。华为昇腾 950 和寒武纪 DCU 完成 Day 0 适配,国产算力首日实现完整推理部署。三次跳票被证实主要源于从 CUDA 到昇腾 CANN 的代码重写。
扫描 18 个信源 · 精选 0 条