🔴 LLM 拒答机制或可被单向量绕过
安全护栏的"单点失守"假设若成立,整个开源生态的对齐范式都要重新设计
HN 热议论文提出语言模型的拒答行为可能由单一潜空间方向控制,abliteration、heretic 等工具已能针对开源模型剥离安全层;评论者把话题延伸到 Qwen 等新一代模型,争论焦点是新模型是否已把拒答编码"分散化",让旧绕过手段逐步失效。攻防节奏从模型层蔓延到工具链,是一场长期军备竞赛。
谷歌、亚马逊、微软、Meta 合计 **7250 亿美元**,较 2025 年 **4100 亿** 同比涨 **77%**,超 2 月预估 **6100 亿**。微软增 **192.3%** 领跑,AI 基建竞赛白热化。
谷歌、亚马逊、微软、Meta 2026 年 AI 资本开支合计 7250 亿美元,较 2025 年 4100 亿 同比 +77%。仅 Q1 四家累计已达 1300 亿。