🔴 DeepSeek V4 Preview 开源:开源距闭源前沿仅 3-6 个月
国产开源模型再次为全球开源阵营托底
——V4 Preview 以 1.6T MoE 参数 + Compressed Sparse Attention 新注意力机制,把开源模型与闭源前沿的代际差从 12 个月压缩至 3-6 个月。 ①架构创新 Compressed Sparse Attention 是 V4 的关键技术亮点,对长上下文场景下的计算/内存效率显著提升;1.6T 参数体量 在公开权重模型中位列前列。技术报告披露多项设计细节,研究者已从中挖出团队力保不变的核心架构取舍。 ②生态影响 DeepSeek 同步推进开源权重 + 多云适配(含华为昇腾)双轨策略,对国内闭源厂商形成持续压力。当开源模型已逼近闭源前沿时,"闭源溢价"的合理性将被重新审视——国内 To B 客户的选型逻辑也会随之改变。