叁笙早安 AI
VOL.2026.05.19 · 10 条 · AI 晨报

Cursor 自研 Composer 2.5 上线,长任务效率领跑

2026 年 5 月 19 日 · 星期二 · 每日清晨 AI 精选
今日头条

Cursor 发布 Composer

**Cursor** 今日上线 **Composer 2.5**,底座 Kimi K2.5,长任务效率最高比同级高 **10 倍**,首周额度翻倍。**这意味着** AI 编程工具长任务竞争正式打响。

今日深度· Cursor 自研 Composer 2.5 上线,长任务效率领跑

事实

Cursor 5 月 18 日上线 Composer 2.5,底座为 Kimi K2.5 二次强化训练,长任务效率最高比同级高 10 倍,首周额度翻倍推广。训练引入文本反馈做信用分配,支持十万 token 长轨迹。

判断

横向看,GitHub Copilot(微软)和 Windsurf 仍外购基础模型;Cursor 首家将长任务训练权握在自己手里。两月前底座被挖出引争议,主动披露已是升级。若 Composer 2.5 在 SWE-bench 进前三,外购派半年内将被迫跟进。

启示

行业冲击:AI 编程工具从"套壳"迈入"自训练"竞争,长任务成新分水岭,外购阵营差距将逐步拉大。读者动作:盯紧两条曲线 -- ① Composer 2.5 是否进 SWE-bench 前三;② Copilot 能否半年内推自训版。谁先落地,谁锁定开发者。

01 重点解读 4 篇
01

🔴 Kimi离职潮与AI人才重组

大厂出"认证履历",创业公司出"股权空间",两条路径正同步吸引同一批人。

K2.5 核心研究员离职后直接创业、首轮估值 20 亿美元,说明顶尖后训练人才在当前市场仍有极高议价空间。MiniMax 用 AI Fellowship 兼职期权抢人,是更灵活的应对策略。盯紧 Kimi 后续是否补充新的后训练人才,以及林俊旸新实验室的研究方向。

02

🔴 AnySearch打通深网,Agent信息能力跃级

Agent 的信息短板不是速度,是深度——AnySearch 瞄准的正是这个盲区。

谷歌公开索引只覆盖约 20% 的互联网内容,剩余 80% 的股权数据、生产级代码库、威胁情报平台长期对 AI 不透明。真正的考验在两点:① 数据合规性(私有库授权问题);② 延迟稳定性(Agent 调用超时整个任务链就断)。可先在研报和安全审计场景做小规模验证,再判断是否适合集成进生产环境。

03

🔴 英伟达790亿季报,真正值得追的数字

营收记录是结果,数据中心 1 万亿年收目标的进展才是信号。

分析师预计 Nvidia Q1 营收 790 亿美元,同比仍在高位。投资者更关心:① 数据中心业务占比是否持续扩大;② Blackwell 架构出货节奏能否跟上需求。若数据中心收入超预期,将强化"GPU 算力仍是 AI 基础设施最核心瓶颈"的判断,云厂商采购预算可能进一步集中在英伟达这侧。

04

🔴 Anthropic:管制倡导者与最大算力买家

Anthropic 同一天既呼吁限制芯片出口,又传出千亿级算力采购,两件事合起来才是完整信号。

表面是政策呼吁,底层逻辑是:Anthropic 认为算力窗口有限,必须在 2028 年前完成囤积,否则对华优势可能收窄到"仅落后几个月"。涨价则是将采购成本向开发者转移。对 Claude API 用户而言,短期内进一步涨价的概率不低。

02 今日速览 10 条
01
🔴 Cursor 发布 Composer
Cursor 今日上线 Composer 2.5,底座 Kimi K2.5,长任务效率最高比同级高 10 倍,首周额度翻倍。这意味着 AI 编程工具长任务竞争正式打响。
02
🔴 Kimi团队研究员离职,林俊旸创业估值20亿
Kimi K2.5 后训练研究员离职,前成员林俊旸创立新实验室,首轮估值 20 亿美元MiniMax 推国内首个 AI Fellowship 兼职期权项目。这意味着大厂训练人才正加速向创业流动。
03
🔴 AnySearch打通谷歌索引外80%互联网
AnySearch 上线,可打通谷歌索引之外 80% 互联网的结构化内容,含股权库、威胁情报平台,AI Agent 借此直接获取可信数据,开发者连夜接入。对做研报和安全审计的团队来说,这是可直接用的基础设施升级。
04
🔴 英伟达Q1营收预计创纪录790亿美元
Nvidia 定于周三发布 Q1 财报,分析师预计营收 790 亿美元,将再创季度纪录。市场盯紧 1 万亿美元数据中心年收目标进展。财报结果将直接影响 AI 算力板块估值与资本流向。
05
🔴 Anthropic千亿抢芯,转头涨价让开发者买单
Anthropic 以中美竞争为由呼吁收紧芯片出口,称 2028 年前不管控美国可能失去主导权,同期传出千亿美元算力采购计划并随即涨价。对 Claude API 用户而言,短期进一步涨价概率不低。
06
🔴 LLM推断用户状态,个体评分稳定性存疑
arXiv 论文引入心理测量框架,实证检验 LLM 在对话系统中推断用户状态(情绪/意图)的可靠性,显示个体评分层面稳定性不足。对依赖 LLM 做用户建模的产品来说,当前方案须独立验证才可信赖。
07
🔴 PaddleOCR 3.5 Transformer
PaddleOCR 3.5 新增 Transformers 引擎,PP-OCRv5PaddleOCR-VL 1.5 可通过 HuggingFace 直接调用。对开发者来说,接入 HF 生态的 OCR 门槛大幅降低。
08
🔴 方言提示词或绕过MoE模型安全层
实测 Qwen3.5-35B-A3B:AAVE 方言提示词会触发与标准英语不同的路由与拒绝行为,移除安全层后差异更显著。这意味着 MoE 模型安全评估在多方言场景存在系统性盲区,值得产品团队扩充测试集。
09
🔴 Tesla P40 跑 Qwen 3.6 27B
Reddit 用户在 Tesla P40 上跑 Qwen 3.6 27B Q5 量化,速度 20t/s;需保持 K cache 为 F16 才可启用 MTP spec。对本地部署玩家来说,旧卡跑主流 27B 已可行。
10
🟡 MacBook Neo大爆款,英特尔野猫湖应战
苹果 MacBook Neo(A18 Pro,4599 元起)全年销量追加至 1000 万台,交付期排到五个月后。英特尔今日在华发布 Wildcat Lake未来半年内双方份额差距将进一步拉大。
扫描 62 个信源 · 精选 10 条