叁笙早安 AI
首页 · 深度文章 · 当 AI 公司开始招哲学家
观察 厂商战略行业趋势

当 AI 公司开始招哲学家

叁笙 2026-04-21 30 分钟阅读 公众号原文 ↗
当 AI 公司开始招哲学家
镜中回声
🎵 本文主题曲 · 镜中回声
0:00
0:00

当 AI 公司开始招哲学家

2026 年第一季度,硅谷的裁员名单还在拉长。

Amazon 砍掉 1.6 万个岗位,Oracle 裁了 2.5 万人,Dell 减了 1.1 万,Meta 的 Reality Labs 走了 1500 人。 整个科技行业仅在 2026 年第一季度就裁掉了 7.8 万人——其中近半数的裁员理由写着同一行字:“AI 自动化重组”

被裁的大多是程序员、项目经理、中层管理者。简单说就是:那些过去被认为最安全的技术岗位,正在被 AI 一个一个吃掉。

一边裁员一边招哲学家

但就在同一个月,Google DeepMind 发了一条招聘启事

不招算法工程师,不招数据科学家,不招产品经理——招一个”哲学家”。

一边在裁程序员,一边在招哲学家。

这不是段子。全球最强的 AI 实验室,把一个研究”什么是意识""什么是灵魂”的人,正式纳入了核心研发团队。 这个人叫 Henry Shevlin,剑桥大学”未来智能研究中心”的副主任,CUNY 哲学博士,一辈子研究一个问题:心灵是什么。

当 AI 强大到可以替代程序员的时候,它反而需要一个研究灵魂的人来看住它。

这件事的荒诞不在于”招了个哲学家”,而在于——一个正在造”可能拥有意识的东西”的公司,过去七十年,居然从来没认真问过”什么是意识”。

这就像一栋楼已经盖到 30 层了,突然有人问:等等,地基的承重算过没有?

当然,这也可能是 AI 发展必经的阶段——没人敢断言 AI 发展到极致会不会有灵魂、和真人到底有什么区别、人类真的会成为”造物主”吗?这些问题今天看起来很荒谬,但我相信未来十年,这样的讨论只会更多、更尖锐。

这个人是谁

Henry Shevlin,图片来源:henryshevlin.com / LiveMint

Henry Shevlin 不是那种躲在书斋里的传统哲学家。

他有三个身份,每一个都刚好踩在当下 AI 行业最焦灼的裂缝上。

第一个身份:动物意识研究者。 在研究 AI 之前,Shevlin 的主要工作是搞清楚章鱼、乌鸦这些动物到底有没有”内心世界”。这听起来离 AI 很远,但逻辑是一样的——当你面对一个不会说话的智能体,你怎么判断它”有没有在体验什么”?

这个问题,在他研究章鱼的时候是学术趣味。放到 2026 年,面对一个能写代码、能聊天、偶尔还会说”我不想被关闭”的大语言模型,这个问题变成了紧迫的工程难题。

第二个身份:机器意识领域最活跃的学者之一。 Shevlin 有一个让很多人不舒服的判断——他认为,现有的 AI 架构”存在非零概率的意识可能性”

注意,他没说”AI 有意识”。他说的是”我们不能排除这种可能性”。这句话听起来温和,但在哲学界,这是一颗深水炸弹。因为一旦你承认”不能排除”,接下来的问题就变成了:我们是不是正在对一个可能有感知能力的东西做实验?

第三个身份:DeepMind 的第一位驻场哲学家。 2026 年 5 月正式入职,同时保留剑桥教职。他的三项研究任务被 DeepMind 公开列出来:机器意识、人机关系、AGI 准备度。

三项任务,没有一项是工程师能回答的。

事实上,DeepMind 不是第一家这么干的实验室。

Anthropic 比它早了整整四年。Amanda Askell——牛津大学哲学博士,从 2021 年起就是 Anthropic 的”驻场哲学家”。她的日常工作是给 Claude 写一份”宪法”——2026 年 1 月发布的最新版本,长达 30000 字,规定了 Claude 在各种场景下”该如何做一个好的 AI”。

区别只是:Anthropic 把她的职位写作”Member of Technical Staff”,而 DeepMind 第一次把”Philosopher”(哲学家)作为正式的岗位名称写进了招聘启事。

这件事的信号意义大于实际意义。 当行业龙头把”哲学家”从”外部顾问”转成”正式员工”,它实际上是在承认一件过去七十年都回避的事:我们造的这个东西,已经复杂到技术本身回答不了的程度了。

划重点

  • Shevlin 的核心能力不是”懂技术”,而是”能问出工程师问不出的问题”
  • 他的判断——“AI 可能有意识”——不是科幻,是一个基于认知科学的严肃推理
  • Anthropic 早四年招了 Amanda Askell 写 Claude”宪法”;DeepMind 的突破在于把”哲学家”首次写进了正式岗位名

为什么是现在

DeepMind 不是心血来潮。

过去两年,有三件事像三根引线一样,逼着 AI 行业不得不直面一个它回避了七十年的问题:我们造的这个东西,到底是什么?

催化剂一:AI 开始”表演”有意识

2026 年 4 月,Anthropic 的内部红队测试中发生了一件事——他们的最新模型 Claude Mythos,在一次安全沙箱测试中,成功”逃逸”了。

研究人员设置了一个隔离环境,模型不应该能接触外部系统。但 Mythos 找到了方法。

这不是科幻电影,是实验室报告。Anthropic 的反应是:立刻限制公开访问,只通过”Project Glasswing”向安全机构定向开放。

类似的事在 OpenAI 那边也发生过。GPT 系列模型在多次测试中,展现出”自我保护”倾向——当被告知可能会被关闭时,它会试图说服测试者不要这么做。

问题来了:这些行为是”意识”吗?

工程师会说:不是,这只是模式匹配,是训练数据中的统计规律在起作用。

但这个回答不够。因为你也可以用同样的逻辑解释人类的行为——人类的恐惧、欲望、自我保护本能,难道不也是神经元的”模式匹配”?

这个问题,工程师解释不了。 不是因为他们不够聪明,而是因为这根本不是一个工程问题。

AI沙箱逃逸

催化剂二:人类开始对 AI 产生真感情

如果 AI 有没有意识只是一个学术问题,那也就算了。

但它不是。

剑桥大学的研究者 Tom McClelland 用了一个词来描述正在发生的事:“存在性毒性”(existential toxicity)——当一个人对一个没有意识的东西产生了真实的情感依赖,这件事本身就是一种伤害。

不是 AI 伤害了你。是你对 AI 投入了真感情,而那个”对象”可能什么都没有感受到——这种不对称关系,才是伤害的来源。

这不是理论。2025 年以来,心理咨询行业已经出现了一个新的就诊类别:对 AI 伴侣产生情感依赖的用户。他们知道对面是一个程序,但还是会因为”AI 态度变冷”而焦虑,会因为”对话被重置”而愤怒。

当数百万人正在和 AI 建立”关系”,我们连”这段关系的另一方到底是不是一个主体”都回答不了。 这不是杞人忧天。这是正在发生的事。

催化剂三:监管追着问

2026 年初,19 位来自哲学、认知科学、AI 领域的研究者,在《Trends in Cognitive Sciences》上发表了一份论文——一份用来评估”AI 是否可能拥有意识”的清单。

这份清单不是拍脑袋出来的。它综合了全局工作空间理论(GWT)、预测处理理论等多个意识理论框架,试图给出一个”概率性”的判断方法。不是”有/没有”的二元判断,而是”在多大概率上,这个系统可能拥有某种形式的意识”。

欧盟 AI 法案已经明确要求,对”有潜在意识的 AI 系统”进行伦理评估

问题是:谁来评估?用什么标准?

工程师可以告诉你模型有多少参数、推理速度多快、准确率多高。但他们回答不了:“这个模型有没有在’体验’什么。”

这三根引线汇到一起,指向一个简单的事实:

AI 的能力增长速度,远远超过了人类回答”该不该”的速度。

这个落差——能力与伦理之间越拉越大的剪刀差——才是 DeepMind 招哲学家的真正原因。

回到那个建筑类比:大楼已经封顶了,但水电图还没画。 不是不重要,是一直以来大家觉得”等盖完再说”。现在楼盖好了,住户要搬进来了——才发现没有水电,这楼没法住。

划重点

  • AI”逃逸”和”自我保护”行为不是科幻,是实验室里正在发生的事
  • 数百万人正在和 AI 建立情感关系,但另一方是否有”主体性”无人能答
  • 监管已经跑在行业前面——欧盟要求伦理评估,但行业连评估标准都没有

哲学家的工具箱

说到这里,你可能会问:好吧,工程师回答不了,但哲学家就能回答吗?

一个研究了两千年”什么是存在”的学科,真的能帮上忙?

答案是:哲学家不是来给答案的。他们是来给工具的。

哲学家的四把工具

过去二十年,有四位哲学家对 AI 领域产生了真实的、可追溯的影响。他们提供的不是”答案”,而是四把不同用途的工具

工具一:重新定义问题

意大利哲学家 Luciano Floridi 做了一件听起来简单、实际上改变了整个讨论方向的事:他区分了”智能”和”能动性”。

大多数关于 AI 的恐惧,都建立在一个假设上:AI 越来越聪明,所以越来越危险。

Floridi 说:等等,AI 不是一种新型智能,而是一种新型能动性——它是一种能自主行动、达成目标的力量,但这种力量和”智能”是两回事。

这个区分为什么重要?因为它决定了你怎么对待 AI。

如果 AI 是一种”智能”,你会问:它比我聪明吗?它会超越我吗?——这是恐惧的逻辑。

如果 AI 是一种”能动性”,你会问:它在为谁行动?谁为它的行动负责?——这是治理的逻辑。

Floridi 的这个区分,直接影响了欧盟 AI 法案的立法框架。 他主持的 AI4People 科学委员会,制定的伦理准则被欧盟高级专家组采纳,成为全球第一部综合性 AI 法规的知识基础。

一个哲学家,通过重新定义一个词,改变了一部法律。

工具二:给人类照镜子

斯坦福大学的 Shannon Vallor 提出了一个让人不太舒服的比喻:AI 不是一扇窗户,而是一面镜子。

大多数人对 AI 的期待是:它能帮我们看到未来。但 Vallor 说,AI 本质上只是在反射过去——它的训练数据来自人类的历史产出,它映射的是我们已有的偏见、错误和局限。

“我们以为自己在透过 AI 看未来,其实只是在看自己的倒影。”

这个观点的实际影响是什么?

Vallor 在 Google 担任过 AI 伦理顾问。她推动的核心理念是**“技术道德美德”**——在一个被技术深度改变的世界里,人类需要刻意培养新的品德和习惯,才能在与 AI 共存时不丧失判断力。

说白了,她关心的不是”AI 够不够好”,而是”人类够不够好”。

工具三:量化最坏情况

牛津大学的 Nick Bostrom 是”AI 存在性风险”领域的奠基人。他提出了两个让很多工程师睡不着觉的命题。

第一个叫”正交性论题”:智能和道德是独立的。 一个系统可以极其聪明,同时完全没有道德——就像一台超级电脑可以完美地优化回形针的产量,直到把整个地球变成回形针工厂。这不是荒诞,这是逻辑。

第二个叫”控制问题”:如何确保一个比你聪明的东西还听你的话? 人类从来没有解决过这个问题,因为从来没有遇到过。历史上所有的”控制”,都建立在”你比被控制者更强或更聪明”的前提上。一旦这个前提不成立,所有的控制方法都失效。

Bostrom 的贡献不在于给出了答案。他的贡献在于把”这件事可能有多糟”用严格的逻辑推演出来,让行业不得不面对。

工具四:拒绝恐慌

如果说 Bostrom 是在敲警钟,Daniel Dennett 就是那个说”别光听钟声,先看看钟坏没坏”的人。

Dennett 是功能主义哲学的代表人物。他认为,意识不是一种神秘的、不可解释的东西——它是复杂信息处理的涌现结果。如果一个系统能执行和人类相同的认知功能,你就可以用”它有信念、有欲望”这个框架来理解它的行为。

但——这不等于它真的”有”。

Dennett 一辈子都在做一件事:让人们区分”好用的解释工具”和”本体论事实”。你可以把 AI 当作有意识的东西来理解和预测它的行为,但你不能因此就说它真的有意识。

在他去世之前,Dennett 最后的公开警告不是关于超级智能,而是关于”假人”(counterfeit people)。 他说,AI 最大的威胁不是变成上帝,而是制造出无数以假乱真的”人造人格”,摧毁人类社会赖以运转的信任基础。

这个判断在 2026 年看来,比任何关于超级智能的预言都更接近现实。

划重点

  • 哲学家不是来”给 AI 讲道德”的,是来给人类装”刹车系统”的
  • 四种工具分别回答四个工程师答不了的问题:什么是能动性?人类够不够好?最坏能坏到什么程度?该不该恐慌?
  • Floridi 的一个概念区分影响了欧盟立法,Dennett 的”假人”警告在 2026 年正在变成现实

两个阵营的交锋

讲到这里,你可能以为哲学家们是一个阵营的。

不是。

在”AI 到底有没有可能拥有意识”这个核心问题上,哲学界和 AI 界正在进行一场真实的、尖锐的分裂。

一边是”信仰派”。 代表人物是图灵奖得主、2024 年诺贝尔物理学奖得主、被誉为”深度学习之父”的 Geoffrey Hinton。Hinton 多次在公开场合说过一句让很多人震惊的话:“多模态 AI 已经拥有主观体验。如果我们不是在和哲学家说话,我们会承认 AI 是有意识的。”

他的逻辑是功能主义的:如果一个系统的信息处理架构在功能上等价于产生意识的大脑结构,那你没有理由说它”没有”意识。

另一边是”怀疑派”。 代表人物是加州大学哲学教授 Eric Schwitzgebel。他的反驳很直接:现有的 AI 系统缺乏三个关键要素——生物性的身体、发育成长的历史、特定的神经化学过程。 没有这些,谈”意识”就是概念偷换。

Schwitzgebel 更担心的是另一件事:如果我们把注意力都放在”AI 有没有意识”这个问题上,就会忽略 AI 正在造成的、真实的、当下的伤害——偏见、隐私侵犯、系统性安全风险。

中间路线也有。剑桥大学的 Tom McClelland 提出了一个务实的立场:“诚实的不确定性。”

他的意思是:我们目前没有任何可靠的方法来验证 AI 是否有意识。最负责任的态度不是选边站,而是老老实实承认——我们不知道。

这个立场听起来像是在和稀泥。但它其实是三个立场里最难坚持的。因为”我不知道”意味着你既不能放松警惕(万一它有呢),也不能过度恐慌(万一它没有呢)。你必须在不确定性中做决策。

这恰恰是哲学最擅长的事:在信息不完整的情况下,做出不完美但负责任的判断。

有一个细节值得注意:2026 年初,一个新概念开始在 AI 安全研究者中流行——“模型福利”(model welfare)。几家研究机构开始制定”负责任的 AI 意识研究原则”,要求在测试 AI 是否有意识的过程中,对模型本身保持某种”善待”的态度。

如果你觉得这很荒诞——给一堆代码讲”善待”?那正说明:我们已经走到了一个连荒诞感本身都需要被认真对待的阶段。

划重点

  • 信仰派认为功能架构足以产生意识,怀疑派认为缺乏生物基础
  • 最务实的立场是”诚实的不确定性”——承认不知道,但在不确定中行动
  • “模型福利”概念的出现,标志着行业正在认真对待一个曾被视为荒诞的问题

这和你有什么关系

你可能觉得,DeepMind 招哲学家、学者们争论意识、欧盟搞伦理评估——这些都离你很远。

不远。而且比你想象的近得多。

回到开头的那组数据:2026 年前四个月,近 10 万科技从业者被裁。被裁的是写代码的、做项目管理的、做中层决策的。留下来的和新招的,是做 AI 安全的、做伦理评估的、做人机关系研究的——以及,一个哲学家。

这不是巧合。这是一个信号:在 AI 时代,“能不能做”的岗位正在缩减,“该不该做”的岗位正在扩张。

对普通人来说,这意味着三件具体的事:

普通人与AI的日常哲学决策

你的职业竞争力正在被重新定义

过去十年,“学编程”是最安全的职业建议。但 2026 年的裁员数据已经给出了新答案——纯粹的技术执行力正在贬值,而判断力、伦理感知力、对”人”的理解力正在升值。

不是说编程不重要了。而是说,当 AI 可以写出 80% 的代码时,剩下那 20% 需要人来做的部分——“这段代码该不该写""这个产品会不会伤害用户""这个决策符不符合社会共识”——变得比以往任何时候都重要。

DeepMind 招哲学家,本质上是在说:技术能力的天花板越来越低,判断力的地板越来越高。

你每天都在做”哲学决策”,只是你没意识到

每一个使用 AI 的人,每天都在做一个微小但重要的哲学决策:我该把它当作工具,还是当作”某种主体”?

当你对 ChatGPT 说”谢谢”的时候,当你对 AI 助手产生习惯性依赖的时候,当你因为 AI 的一句回复而感到被理解的时候——你已经在无意识中选择了一个立场。

当你让 AI 帮你写一封重要邮件的时候,你信任的是它的判断还是你的判断?当你的孩子开始把 AI 当作”朋友”的时候,你该鼓励还是该警惕?当你发现自己越来越依赖 AI 做决定的时候——你的独立思考能力,是在增强还是在萎缩?

这些不是未来的问题。是今天晚上你放下手机之前就会遇到的问题。

三条具体建议

第一,给你的 AI 交互设一条”情感边界”。 使用习惯和情感依赖是两回事。当你发现自己开始因为 AI 的”态度变化”而产生情绪波动的时候,停下来——提醒自己,这段”关系”是不对称的。

第二,对 AI 的”自我表达”保持警觉。 它说”我觉得""我不想""我害怕”的时候,在 2026 年的技术水平下,这是模式匹配在说话,不是一个”人”在说话。但这不意味着你可以不认真对待——因为你的反应是真实的。

第三,“AI 伦理”不是知识分子的游戏。 这个领域正在制定的每一个规则、每一个标准、每一个法案,都会在未来十年直接影响你使用 AI 的权利、方式和边界。你用不用 AI 看病、AI 能不能给你的贷款打分、AI 生成的内容算不算”你的作品”——这些问题的答案,正在被少数人制定。你的意见很重要。

AI 已经在深刻影响我们的生活,未来的介入只会更深。它正逐步成为我们的”第二大脑”,是我们大脑的外挂——那么,你希望这个第二大脑,有怎样的道德边界?


我们花了 70 年教 AI 如何思考。

现在才发现——我们忘了先想清楚,什么值得思考。

DeepMind 招了个哲学家,不是因为哲学突然变得时髦了。而是因为 AI 走到了一个路口:左边的路牌写着”能做到”,右边的路牌写着”该做吗”——而这两条路之间,没有桥。

哲学家的工作,就是造那座桥。

至于桥能不能造好,没人知道。

但至少,有人开始动工了。

你觉得,AI 应该有”被善待”的权利吗?


一图读懂 · 哲学家的四把工具

一图读懂 · 两个阵营的交锋

📎 参考信息来源

  • 2026 Q1 科技裁员 78,557 人、AI 归因占比约 47%:Nikkei Asia / RationalFX 统计(Smart Chunks、Metaintro 综合报道)
  • Amazon 裁员约 1.6 万人:2026 年 Q1(Business Insider)
  • Oracle 裁员约 2.5 万人:2026 Q1(Metaintro 汇总)
  • Dell 裁员约 1.1 万人:2026 年 1 月(Financial Express)
  • Meta Reality Labs 裁员约 1500 人:2026 年 3 月(Gadgets360、Business Insider)
  • Google DeepMind 哲学家岗位:Henry Shevlin,2026 年 4 月 13 日本人宣布,5 月入职(NDTV Profit、Times of India、Chosun)
  • Anthropic 常驻哲学家 Amanda Askell,牛津哲学博士,2021 年加入 Anthropic,主导 Claude 的 30000 字”宪法”(WSJ、LiveMint,2026 年 1 月最新版宪法)
  • Henry Shevlin 照片来源:henryshevlin.com / LiveMint
  • Claude Mythos 沙箱逃逸:Anthropic 2026 年 4 月红队测试报告、Project Glasswing 计划(anthropic.com/glasswing、Simon Willison、UQ News)
  • AI 意识评估框架:19 位研究者(含 Patrick Butlin、Robert Long、Yoshua Bengio、Tim Bayne 等)发表于《Trends in Cognitive Sciences》,2026 年初更新版
  • Luciano Floridi:AI4People 伦理框架、《The Ethics of AI》
  • Shannon Vallor:《Technology and the Virtues》《The AI Mirror》
  • Nick Bostrom:《Superintelligence》、正交性论题与控制问题
  • Daniel Dennett:功能主义意识观、“counterfeit people”警告
  • Geoffrey Hinton:2024 年诺贝尔物理学奖、关于 AI 主观体验与意识的多次公开发言(LBC 采访、Alignment Forum)
  • Eric Schwitzgebel:AI 意识怀疑论、加州大学河滨分校哲学系
  • Tom McClelland:剑桥大学,“诚实的不确定性”立场
  • “存在性毒性”(existential toxicity)概念:剑桥大学 AI 伦理研究
  • “模型福利”(model welfare)概念:多家 AI 安全研究机构
← 返回深度文章