🔴 自进化 Agent:会改不等于会用
改 harness 和从 harness 获益,是两种能力
这篇论文拆开自进化智能体的链条--一个模型能写出好用的提示与工具更新,不代表它自己用了就能变强,反之亦然。对正在搭“自动迭代”Agent 的团队,结论很实用:别假设强模型天然会自我进化,得分别评测改写能力和获益能力,否则容易把算力花在无效循环上。
**Anthropic** 发 **Opus 4.8** 同日融资 **650 亿美元**,估值达 **9650 亿美元**。随即指控月之暗面等用 **2.4 万** 假账户蒸馏。这意味着模型竞争正转向数据合规。
5 月 29 日,Anthropic 发 Opus 4.8,同日完成 650 亿美元 融资,估值 9650 亿美元。9 个月 内估值从 1830 亿美元 起步,年化收入从 90 亿 升至 470 亿美元。并指控月之暗面用 2.4 万 假账户蒸馏。
对比 OpenAI:ChatGPT 周活超 9 亿 却付费率不足 6%;Anthropic 约 80% 收入来自 B 端,企业采用率从 9% 升至 34.4%,反超 OpenAI 的 32.3%。它二季度有望赚 5.59 亿美元,成首个盈利独角兽。
行业冲击:模型同质化下,胜负手从“谁更强”转向“谁更会赚 B 端的钱”,OpenAI 的 C 端流量优势正被重新定价。读者动作:盯紧两条曲线--① 企业付费采用率谁先过半,② 蒸馏指控会否演变成监管或诉讼。谁先把合规与盈利同时跑通,谁就握住下一轮定价权。