2026-05-19 AI 日报 · 叁笙早安 AI

今日头条

Cursor 发布 Composer

**Cursor** 今日上线 **Composer 2.5**，底座 Kimi K2.5，长任务效率最高比同级高 **10 倍**，首周额度翻倍。**这意味着** AI 编程工具长任务竞争正式打响。

今日深度· Cursor 自研 Composer 2.5 上线，长任务效率领跑

事实

Cursor 5 月 18 日上线 Composer 2.5，底座为 Kimi K2.5 二次强化训练，长任务效率最高比同级高 10 倍，首周额度翻倍推广。训练引入文本反馈做信用分配，支持十万 token 长轨迹。

判断

横向看，GitHub Copilot（微软）和 Windsurf 仍外购基础模型；Cursor 首家将长任务训练权握在自己手里。两月前底座被挖出引争议，主动披露已是升级。若 Composer 2.5 在 SWE-bench 进前三，外购派半年内将被迫跟进。

启示

行业冲击：AI 编程工具从"套壳"迈入"自训练"竞争，长任务成新分水岭，外购阵营差距将逐步拉大。读者动作：盯紧两条曲线 -- ① Composer 2.5 是否进 SWE-bench 前三；② Copilot 能否半年内推自训版。谁先落地，谁锁定开发者。

01 重点解读 4 篇

🔴 Kimi离职潮与AI人才重组

大厂出"认证履历"，创业公司出"股权空间"，两条路径正同步吸引同一批人。

K2.5 核心研究员离职后直接创业、首轮估值 20 亿美元，说明顶尖后训练人才在当前市场仍有极高议价空间。MiniMax 用 AI Fellowship 兼职期权抢人，是更灵活的应对策略。盯紧 Kimi 后续是否补充新的后训练人才，以及林俊旸新实验室的研究方向。

🔴 AnySearch打通深网，Agent信息能力跃级

Agent 的信息短板不是速度，是深度——AnySearch 瞄准的正是这个盲区。

谷歌公开索引只覆盖约 20% 的互联网内容，剩余 80% 的股权数据、生产级代码库、威胁情报平台长期对 AI 不透明。真正的考验在两点：① 数据合规性（私有库授权问题）；② 延迟稳定性（Agent 调用超时整个任务链就断）。可先在研报和安全审计场景做小规模验证，再判断是否适合集成进生产环境。

🔴 英伟达790亿季报，真正值得追的数字

营收记录是结果，数据中心 1 万亿年收目标的进展才是信号。

分析师预计 Nvidia Q1 营收 790 亿美元，同比仍在高位。投资者更关心：① 数据中心业务占比是否持续扩大；② Blackwell 架构出货节奏能否跟上需求。若数据中心收入超预期，将强化"GPU 算力仍是 AI 基础设施最核心瓶颈"的判断，云厂商采购预算可能进一步集中在英伟达这侧。

🔴 Anthropic：管制倡导者与最大算力买家

Anthropic 同一天既呼吁限制芯片出口，又传出千亿级算力采购，两件事合起来才是完整信号。

表面是政策呼吁，底层逻辑是：Anthropic 认为算力窗口有限，必须在 2028 年前完成囤积，否则对华优势可能收窄到"仅落后几个月"。涨价则是将采购成本向开发者转移。对 Claude API 用户而言，短期内进一步涨价的概率不低。

02 今日速览 10 条

🔴 Cursor 发布 Composer

Cursor 今日上线 Composer 2.5，底座 Kimi K2.5，长任务效率最高比同级高 10 倍，首周额度翻倍。这意味着 AI 编程工具长任务竞争正式打响。

🔴 Kimi团队研究员离职，林俊旸创业估值20亿

Kimi K2.5 后训练研究员离职，前成员林俊旸创立新实验室，首轮估值 20 亿美元；MiniMax 推国内首个 AI Fellowship 兼职期权项目。这意味着大厂训练人才正加速向创业流动。

🔴 AnySearch打通谷歌索引外80%互联网

AnySearch 上线，可打通谷歌索引之外 80% 互联网的结构化内容，含股权库、威胁情报平台，AI Agent 借此直接获取可信数据，开发者连夜接入。对做研报和安全审计的团队来说，这是可直接用的基础设施升级。

🔴 英伟达Q1营收预计创纪录790亿美元

Nvidia 定于周三发布 Q1 财报，分析师预计营收 790 亿美元，将再创季度纪录。市场盯紧 1 万亿美元数据中心年收目标进展。财报结果将直接影响 AI 算力板块估值与资本流向。

🔴 Anthropic千亿抢芯，转头涨价让开发者买单

Anthropic 以中美竞争为由呼吁收紧芯片出口，称 2028 年前不管控美国可能失去主导权，同期传出千亿美元算力采购计划并随即涨价。对 Claude API 用户而言，短期进一步涨价概率不低。

🔴 LLM推断用户状态，个体评分稳定性存疑

arXiv 论文引入心理测量框架，实证检验 LLM 在对话系统中推断用户状态（情绪/意图）的可靠性，显示个体评分层面稳定性不足。对依赖 LLM 做用户建模的产品来说，当前方案须独立验证才可信赖。

🔴 PaddleOCR 3.5 Transformer

PaddleOCR 3.5 新增 Transformers 引擎，PP-OCRv5 与 PaddleOCR-VL 1.5 可通过 HuggingFace 直接调用。对开发者来说，接入 HF 生态的 OCR 门槛大幅降低。

🔴 方言提示词或绕过MoE模型安全层

实测 Qwen3.5-35B-A3B：AAVE 方言提示词会触发与标准英语不同的路由与拒绝行为，移除安全层后差异更显著。这意味着 MoE 模型安全评估在多方言场景存在系统性盲区，值得产品团队扩充测试集。

🔴 Tesla P40 跑 Qwen 3.6 27B

Reddit 用户在 Tesla P40 上跑 Qwen 3.6 27B Q5 量化，速度 20t/s；需保持 K cache 为 F16 才可启用 MTP spec。对本地部署玩家来说，旧卡跑主流 27B 已可行。

🟡 MacBook Neo大爆款，英特尔野猫湖应战

苹果 MacBook Neo（A18 Pro，4599 元起）全年销量追加至 1000 万台，交付期排到五个月后。英特尔今日在华发布 Wildcat Lake，未来半年内双方份额差距将进一步拉大。

扫描 62 个信源 · 精选 10 条