AI 手机大战,争的不是谁更聪明,是谁能进门

“AI 不缺聪明。它缺的,是谁愿意让它进门。”
2025 年 12 月 1 日,一台叫”豆包手机”的手机正式上市。3499 元,字节跳动出 AI、中兴努比亚出硬件。它最大的卖点只有一句话:你开口说一件事,它就替你的手指在屏幕上点来点去,自己把外卖点了、把车叫了、把钱付了。
这台手机火得不像话。首批约 3 万台,当天售罄,二手市场一度炒到上万元(据极客公园、量子位等多家报道)。
可它的高光只持续了一天。
12 月 2 日,有人发现自己刚抢到的豆包手机打不开微信了,屏幕上跳出一行字:登录环境异常。紧接着,农行、建行的风控提示也来了,支付宝、淘宝、美团陆续点不开(据澎湃新闻、科创板日报、36 氪等报道)。又过了三天,字节自己主动下线了手机上操作银行、支付的能力。
一台最抢手的 AI 手机,前后不到一周,就从顶流变成了”违规设备”。它不是因为不够聪明被赶出门的,恰恰相反,是它太想替你动手—豆包要伸手进的那几扇门,全被人从里面反锁了。
这件事,藏着 2026 下半年这场 AI 手机大战真正的剧本。今年下半年,手机厂商照例要扎堆更新,苹果、谷歌、华为、小米都把”AI”两个字印在了最显眼的地方,连微信、支付宝都说要接入 AI。听上去,AI 替你用手机这件事,就差临门一脚。
但豆包手机已经先替所有人趟过雷了。它用短短几天证明了一件事:这一脚最难的地方,不是 AI 够不够聪明,是它进不进得了门。

一台手机被赶出门的那一周
先把这台手机说清楚,因为它踩中的那个坑,后面每一家都会遇到。
一台能替你点屏幕的手机
豆包手机不是字节自己造的整机。字节负责那个叫”豆包”的 AI 助手,硬件交给中兴旗下的努比亚(机型代号 nubia M153)。三方的分工,字节、中兴、努比亚都对外承认过。所以严格说,它不是”字节手机”,是”装了字节 AI 的中兴手机”。
它真正不一样的地方,在于那个 AI 怎么干活。
过去你用语音助手,最多是”帮我打开美团”,剩下的还得自己点。豆包手机想做的是下一步:你说”帮我点一杯不加糖的拿铁”,它直接钻进外卖 App,替你选规格、填地址、付钱,全程不用你碰屏幕。
它靠什么做到的?靠一个叫 INJECT_EVENTS 的系统级权限(据财联社报道,字节方面也承认了这一点)。说人话,就是这台手机的 AI 能”模拟你的手指”,在任何一个 App 里替你点、替你划、替你输入。它绕过了每个 App 自己的大门,直接从系统层伸手进去替你操作。
它们守的,是同一道门
问题就出在这”伸手”上。
你想想,微信、支付宝、淘宝、美团,它们最值钱的东西是什么?不是那个聊天框或者下单页,是你这个用户,以及你在它们家留下的全部数据和习惯。一个外来的 AI,绕过它们的入口,直接替你在里面操作,等于把它们辛苦圈了十几年的地,变成了别人随便进出的过道。换谁都不干。
于是就有了那一周的围剿。这不是哪一家临时起意,是几乎所有超级 App 不约而同地动手—因为它们守的是同一道东西。
这一幕,其实在中国互联网史上演过。2014 年那个春节,微信用一个”抢红包”的小游戏,一夜之间让几千万人绑定了银行卡,据说马云在内部把这称作”偷袭珍珠港”。那一战,争的不是几块钱红包,是移动支付的入口。十二年前争的是支付的入口,今天争的是 AI 的入口—剧本没变,只是这次想抢门的,从另一个 App,换成了 AI。
一颗信号弹,不是失败品
所以豆包手机不是一件失败品,它是一颗信号弹。它第一次让所有人—苹果、谷歌、腾讯、阿里、字节—都看清了同一道题:AI 要替你用手机,绕不开”谁掌握 App 入口”这道坎。
顺便说一句,它也没像很多人以为的那样”终止”了。据 36 氪等媒体报道,字节已经在做二代,仍和中兴努比亚合作,还提前去跟打车、外卖、订票的几家 App 谈好了”停火”,让 AI 能进它们的门。只是二代的具体时间,各家爆料口径不一,截至 6 月还没上市,这里只能说”据报道”。
一颗信号弹打上天之后,中美两边的玩家,给出了两种完全不同的解法。
美国的拆墙队
美国这条路,是让操作系统自己当”那个 AI”,然后用一套统一的规矩,逼着所有 App 把门打开。
苹果:把围墙拆了,让 App 自己开门
2026 年 6 月 8 日,蒂姆·库克作为 CEO 主持了他任内最后一场 WWDC(苹果官方已宣布他将于 9 月 1 日卸任、由约翰·特纳斯接任)。这场发布会的主角,是一个被彻底重做的 Siri,官方叫它”Siri AI”,随今年秋季的 iOS 27 一起来。
新 Siri 被官方点名的能力有四样:记得你的个人情境(比如从你几个月前的邮件里翻出酒店确认号)、看得懂你当前的屏幕、能在系统层面替你操作 App、还能联网回答世界知识。前三样,正是豆包手机想干却被打出来的事。
但苹果走了一条和豆包完全相反的路。它不靠”模拟手指”硬闯,而是给开发者一套叫 App Intents 的框架—你这个 App 想被 Siri 调用,就按苹果的规矩,把”发邮件""改照片”这些能力,规规矩矩地登记出来。苹果甚至在这次发布会上正式弃用了老的 SiriKit,意思很明确:以后想接入系统级 AI,只有这一条门路。
这就是美国路径的内核:不是 AI 偷偷溜进 App,是操作系统定一套标准,让每个 App 自己把门打开、把能力交出来。 入口统一,体验一致,谁也不用偷。
代价是,这套迁移要时间。开发者得一个个改,行业普遍估计要两三年才铺得开。在那之前,Siri 能替你干的,也就是那些已经”登记”过的活。
谷歌:Gemini 直接接管了安卓
谷歌那边更直接。
2026 年 5 月 12 日,谷歌发布了 Gemini Intelligence,官方原话是要”把安卓从一个操作系统,变成一个智能系统”。和苹果的 App Intents 对应,谷歌也有自己的一套 App 接入框架。
最值得说的是,谷歌的”AI 替你操作手机”不是 PPT 上的画饼,是真上线了。它有个功能叫屏幕自动化(screen automation),能在选定的 App 里替你订车、点餐、买菜—这一条写在谷歌官方的帮助页里,已经是测试版功能,只是目前限定在 Pixel 10 和三星 Galaxy S26 这些机型、限定美国和韩国、限定英文。三星更激进,年初的 Galaxy S26 直接自称”全球首款 agentic AI 手机”(agentic,指能自己规划并完成多步任务的 AI)。
不过,热闹里藏着一个容易被忽略的门槛:你想用上这些,多半得换新机。谷歌给 Gemini Intelligence 划了硬线—旗舰芯片、12GB 以上内存、支持端侧的 Gemini Nano v3—去年的旗舰,比如 Pixel 9,直接被挡在门外。
同一部 iPhone,两个大脑
美国这条路上,还埋着一个对中国用户格外刺眼的细节。
新 Siri 的底层,是苹果和谷歌合作定制的第三代 Apple Foundation Models,苹果和谷歌双方都官方承认了”基于 Gemini”。据彭博社报道,苹果为此每年要付谷歌约 10 亿美元,用的是一个约 1.2 万亿参数的超大定制模型(金额和参数是彭博的报道,苹果没官宣)。
这里有个被很多人传错的细节值得纠一下:这个最强的云端模型,跑在谷歌云里的英伟达芯片上,不是苹果自己的数据中心。苹果是把它那套隐私计算扩展到了谷歌的服务器上—用 Ars Technica 的标题说,“苹果说它的 AI 仍然是私密的,哪怕它跑在谷歌的服务器上”。当然,苹果高管也反复强调,这不等于”Siri 就是套了个壳的 Gemini”,他们自研的模型里”没有一行 Gemini 的代码”,谷歌主要用在训练和云端基建。
真正的问题是:这套全球版 Siri,中国大陆用不了。
苹果官方明确说了,新的 Apple Intelligence 和 Siri AI,因为监管原因,在中国大陆和欧盟暂不可用,中国没有时间表。而据多家媒体此前报道,中国版的方案另起一套,主要靠阿里的通义千问,再加百度(这部分是报道,未官宣)。
把这两件事放一起,就是一个有点荒诞的画面:同一部 iPhone,美国人手里那个 Siri 的大脑是谷歌 Gemini,中国人手里这个(如果哪天能用上)大脑是阿里通义。同一个壳,两套 AI。 你的 Siri 到底是谁,取决于你在哪儿买的手机、归哪儿的监管管。

中国的窄门
苹果谷歌能强拆 App 的围墙,是因为它们自己就是地主—iOS 和安卓的地是它们的,App 只能按它们的规矩来。
中国不一样。这里的地主,是微信、支付宝这些超级 App 自己。没人能逼它们开门。于是中国走出了第二条路:不拆墙,开一道自己说了算的窄门。
微信:门我开,但只开这么大
豆包手机被围剿,最直接的后果,是逼着微信想清楚了一件事:硬闯不行,那不如我自己定规矩,开一道受控的门。
2026 年 6 月初,微信和华为、荣耀、小米、OPPO、vivo 几家手机厂商谈成了一种叫 A2A 的合作(Agent-to-Agent,简单说就是”AI 对 AI 喊话”)。以后你对手机的语音助手说”用微信给老王打个视频”,手机助手不用模拟你的手指硬点,而是隔着门跟微信打个招呼,微信自己把活干了再把结果递回来。荣耀的 YOYO 助手已经率先用上了。
注意这和豆包手机的根本区别:决定开不开门、开多大的,是微信,不是那个 AI。 现在微信只开了发消息、打电话、收付款码这类低风险、高频的小口子,别的一概免谈。
同一个 6 月 8 日,微信还给小程序开发者发了份指引,说以后微信自己的 AI 可以调用你的小程序帮用户办事,京东、美团、滴滴、携程是第一批内测。不过这套目前还是测试版,普通用户暂时用不上。
系统这边:华为小米也在重做大脑
手机厂商系统这一侧,中国并不落后,某种程度上还更激进。
2026 年 6 月 12 日,华为开发者大会上发布了 HarmonyOS 7,整个系统转向了 Agent 架构,语音助手小艺被升级成”系统智慧大脑”,官方说它能调用 2100 多项系统能力。更早之前,小艺其实已经在一些真实场景里替用户干活了,比如在深圳航空里选座、在叮咚买菜里下单。
小米这边,卢伟冰在 5 月底官宣了新一代澎湃 OS 七八月发布,超级小爱要和一个叫 Miclaw 的智能体合体。有意思的是,小米自己都很诚实地说,Miclaw 现在还不推荐普通用户日常使用—这句大实话,我们下一节会专门讲。
超级 App:交易闭环是真做出来了
如果说系统级 AI 各家还在追赶,那中国超级 App 自己的 AI 化,有一件事是实打实领先的:它们是真能替你把一笔生意从头做到尾。
阿里的通义千问,5 月已经和淘宝打通了完整的购物闭环—你跟它说想买什么,它能直接在淘宝里帮你挑、帮你下单(千问全端月活,按阿里财报口径已超 3 亿;第三方机构 QuestMobile 的口径要小得多,约 1.66 亿,这种数字得带上是谁算的)。豆包接进了抖音电商,飞猪有”问一问”,美团有”小美”,滴滴、高德的打车也都接了 AI。
支付宝走得更远。它在 5 月底开了一场 AI 支付生态大会,抛出了”智能体支付""AI 钱包”这些概念;它还单独做了个叫”灵光”的 AI App,上线 6 天下载量就破了 200 万。
至于传了很久的”AI 版支付宝”,目前还只是传闻—彭博、科创板日报、晚点都援引知情人士说有这么个东西,但蚂蚁对所有媒体都拒绝置评,从没官宣。据接触过内测版的人说,它现在能做的也就是给点资产配置建议、办点生活服务,离”替你自动转账理财”还远着。所以这件事,下半年只能说”有可能”,不能说”已经来了”。
把这些拼起来,你会发现中国路径有个独特的体感。
一个普通用户,现在确实已经能在淘宝里跟 AI 说句话就把东西买了。但你一旦换个平台,它立刻就”装不知道”了—千问只逛得了淘系,让它去隔壁比个价,它要么不会,要么直接告诉你对手家更便宜。每个超级 App 都把 AI 武装到了自己院子里,可院墙照样一堵不少。AI 能在院子里替你跑腿,却跨不过那道墙。
这就是中美两条路最大的不同。

美国是操作系统当裁判,定一套标准,逼所有 App 把能力交出来,入口统一,但生态迁移慢,而且苹果在中国还缺席;中国是超级 App 各自为政,门开不开、开多大全凭自己,数据厚、履约强、闭环真,但谁也不肯把入口让给谁,跨平台这件事基本做不到。
一个强拆围墙,一个各开窄门。背后其实是两边平台权力结构的差别—美国的地主是操作系统,中国的地主是超级 App。
喊得响,未必用得上
讲到这儿,你可能已经觉得 AI 替你用手机这事八九不离十了。各家都在发,闭环也都通了,似乎就差全面铺开。
但这正是要泼一盆冷水的地方。
最该看的不是发布会,是实测。21 世纪经济报道做过一次评测,找了 7 款手机的 AI 智能体,跑了 70 次真实任务,结果整体成功率只有大约两成:将近四成的任务启动后中途就断了,还有约四分之一干脆失败、退回到只能跟你聊聊天的状态。换句话说,你十次让它替你办事,大概有八次它办砸或者办不成。前面提过,连小米官方都直说自家的 Miclaw 不推荐普通用户日常用—厂商自己心里是有数的。
第二盆冷水,是门槛。
前面说过,谷歌的 Gemini Intelligence 要旗舰芯片加 12GB 以上内存。这意味着,“AI 手机”在 2026 下半年大概率不是一次系统升级就能白得的福利,而是你得掏钱换一台新的高端机。手里那台用了两三年的旗舰,很可能直接没资格用上这些。
第三盆,泼给那些盼着”豆包手机式大爆发”的人。
会不会今年下半年,又冒出一堆专门的 AI 硬件、像去年豆包手机那样引爆市场?大概率不会。专门为 AI 造的独立硬件,这两年其实集体摔了跟头—号称要取代手机的 Humane AI Pin,2025 年初卖身给惠普、产品停售;另一款明星产品 Rabbit R1,最后也退回成了一个手机 App。豆包手机本质上也是一台安卓机加一个系统级 AI,而且一代已经受挫。
至于”真正的纯 AI 手机”,确实有人在做,但那是 OpenAI,据分析师郭明錤爆料,量产要等到 2027 年—而且这是 OpenAI 的事,跟谷歌没关系,中文圈经常把这事误安到谷歌头上,得分清楚。
所以 2026 下半年的真实状态是这样的:口号已经落地成了产品,但产品离”你敢放心托付”,还差着一大截。 AI 不缺聪明,缺的是稳定地、被允许地,进到你那些 App 的门里去。
下半年,AI 离你有多近
泼完冷水,还是得回答最初那个问题:2026 年下半年,AI 离你的手机,到底有多近?
把各家已经摆上桌的牌、和靠谱的爆料拼起来,可以分成四档来看。
◎ 几乎一定会发生的: 苹果的 Siri AI 会在秋季随 iOS 27 落地,但中国大陆大概率还是用不上;谷歌的 Gemini Intelligence 会从首批机型扩展到更多旗舰;国产旗舰会在九十月扎堆首发系统级 AI(小米新系统七八月、华为 Mate90 秋季都已官方定调);微信的 A2A 会陆续接入其余几家手机厂商。
◎ 很可能发生的: 微信面向普通用户的 AI 智能体进入灰度测试(但腾讯反复强调,这取决于监管审批);豆包上线付费订阅;以及—按 IDC 的预测—中国新一代 AI 手机的渗透率,今年有望过半(这是预测,不是已经发生的事实)。
◎ 不确定的: 豆包手机二代到底什么时候发(爆料口径互相矛盾,截至 6 月还没上市);苹果的首款折叠屏(多方确认会晚于 9 月,具体时间未定)。
◎ 大概率不会发生的: 出现复制”豆包手机”的专用 AI 硬件大爆发;苹果 Siri AI 在下半年于中国大陆上线;以及,手机端跑出一套通用的 AI 互操作标准—更现实的,还是各家用自己的框架和私有授权各玩各的。

往远一点看,方向是清楚的。国务院去年的”人工智能+“行动意见里,定了 2027 年新一代智能终端、智能体的普及率要超过 70%。这事是会来的。
但今天我们看清的,是它来的方式。
AI 离你的生活,硬件上其实只隔着一次系统更新、一台新手机的距离。可制度上,它隔着的是一整道”谁让它进门”的墙—苹果谷歌在中国缺席,微信支付宝把门攥在自己手里,超级 App 之间谁也不肯先让步。真正决定 AI 离你多近的,从来不是模型的聪明程度,是这些门后面的人,愿不愿意把钥匙交出来。
所以今年下半年,当你站在柜台前,要不要为了那个”AI”标签换一台新机,敢不敢哪天真让手机替你把钱付了—你这一票投或不投,本质上,是在替这场还远没结束的”接口之争”,投下你自己的判断。
这场仗,值得你接着看下去。