🟡 小米开源模型对标 Claude Opus
token 效率成新战场
小米 MiMo-V2.5-Pro 以 40-60% 更少 token 消耗逼近 Claude Opus 4.6 的编程基准,标志着中国开源模型的竞争重心从跑分排名转向"更便宜跑多久"。这与 DeepSeek 的路线一脉相承:用算法优化换规模优势,对 Anthropic 的 API 定价构成间接压力。
iPhone 16 Pro 测试 Gemma4 E4B 结果显示,GPU 模式的 Prefill 速度比 CPU 快 **10-20 倍**,但 Decode 阶段瓶颈转向内存带宽,揭示移动端推理的关键分层。
Sharp 是苹果的图像到 3D 模型,核心是单张照片生成可渲染三维场景。开发者通过 ONNX Ru。