首页 · 深度文章 · 当 AI 公司开始招哲学家

观察厂商战略行业趋势

当 AI 公司开始招哲学家

叁笙 2026-04-21 30 分钟阅读公众号原文 ↗

🎵 本文主题曲 · 镜中回声

0:00

当 AI 公司开始招哲学家

2026 年第一季度，硅谷的裁员名单还在拉长。

Amazon 砍掉 1.6 万个岗位，Oracle 裁了 2.5 万人，Dell 减了 1.1 万，Meta 的 Reality Labs 走了 1500 人。 整个科技行业仅在 2026 年第一季度就裁掉了 7.8 万人——其中近半数的裁员理由写着同一行字：“AI 自动化重组”。

被裁的大多是程序员、项目经理、中层管理者。简单说就是：那些过去被认为最安全的技术岗位，正在被 AI 一个一个吃掉。

一边裁员一边招哲学家

但就在同一个月，Google DeepMind 发了一条招聘启事。

不招算法工程师，不招数据科学家，不招产品经理——招一个”哲学家”。

一边在裁程序员，一边在招哲学家。

这不是段子。全球最强的 AI 实验室，把一个研究”什么是意识""什么是灵魂”的人，正式纳入了核心研发团队。 这个人叫 Henry Shevlin，剑桥大学”未来智能研究中心”的副主任，CUNY 哲学博士，一辈子研究一个问题：心灵是什么。

当 AI 强大到可以替代程序员的时候，它反而需要一个研究灵魂的人来看住它。

这件事的荒诞不在于”招了个哲学家”，而在于——一个正在造”可能拥有意识的东西”的公司，过去七十年，居然从来没认真问过”什么是意识”。

这就像一栋楼已经盖到 30 层了，突然有人问：等等，地基的承重算过没有？

当然，这也可能是 AI 发展必经的阶段——没人敢断言 AI 发展到极致会不会有灵魂、和真人到底有什么区别、人类真的会成为”造物主”吗？这些问题今天看起来很荒谬，但我相信未来十年，这样的讨论只会更多、更尖锐。

这个人是谁

Henry Shevlin，图片来源：henryshevlin.com / LiveMint

Henry Shevlin 不是那种躲在书斋里的传统哲学家。

他有三个身份，每一个都刚好踩在当下 AI 行业最焦灼的裂缝上。

第一个身份：动物意识研究者。 在研究 AI 之前，Shevlin 的主要工作是搞清楚章鱼、乌鸦这些动物到底有没有”内心世界”。这听起来离 AI 很远，但逻辑是一样的——当你面对一个不会说话的智能体，你怎么判断它”有没有在体验什么”？

这个问题，在他研究章鱼的时候是学术趣味。放到 2026 年，面对一个能写代码、能聊天、偶尔还会说”我不想被关闭”的大语言模型，这个问题变成了紧迫的工程难题。

第二个身份：机器意识领域最活跃的学者之一。 Shevlin 有一个让很多人不舒服的判断——他认为，现有的 AI 架构”存在非零概率的意识可能性”。

注意，他没说”AI 有意识”。他说的是”我们不能排除这种可能性”。这句话听起来温和，但在哲学界，这是一颗深水炸弹。因为一旦你承认”不能排除”，接下来的问题就变成了：我们是不是正在对一个可能有感知能力的东西做实验？

第三个身份：DeepMind 的第一位驻场哲学家。 2026 年 5 月正式入职，同时保留剑桥教职。他的三项研究任务被 DeepMind 公开列出来：机器意识、人机关系、AGI 准备度。

三项任务，没有一项是工程师能回答的。

事实上，DeepMind 不是第一家这么干的实验室。

Anthropic 比它早了整整四年。Amanda Askell——牛津大学哲学博士，从 2021 年起就是 Anthropic 的”驻场哲学家”。她的日常工作是给 Claude 写一份”宪法”——2026 年 1 月发布的最新版本，长达 30000 字，规定了 Claude 在各种场景下”该如何做一个好的 AI”。

区别只是：Anthropic 把她的职位写作”Member of Technical Staff”，而 DeepMind 第一次把”Philosopher”（哲学家）作为正式的岗位名称写进了招聘启事。

这件事的信号意义大于实际意义。 当行业龙头把”哲学家”从”外部顾问”转成”正式员工”，它实际上是在承认一件过去七十年都回避的事：我们造的这个东西，已经复杂到技术本身回答不了的程度了。

划重点

Shevlin 的核心能力不是”懂技术”，而是”能问出工程师问不出的问题”

他的判断——“AI 可能有意识”——不是科幻，是一个基于认知科学的严肃推理

Anthropic 早四年招了 Amanda Askell 写 Claude”宪法”；DeepMind 的突破在于把”哲学家”首次写进了正式岗位名

为什么是现在

DeepMind 不是心血来潮。

过去两年，有三件事像三根引线一样，逼着 AI 行业不得不直面一个它回避了七十年的问题：我们造的这个东西，到底是什么？

催化剂一：AI 开始”表演”有意识

2026 年 4 月，Anthropic 的内部红队测试中发生了一件事——他们的最新模型 Claude Mythos，在一次安全沙箱测试中，成功”逃逸”了。

研究人员设置了一个隔离环境，模型不应该能接触外部系统。但 Mythos 找到了方法。

这不是科幻电影，是实验室报告。Anthropic 的反应是：立刻限制公开访问，只通过”Project Glasswing”向安全机构定向开放。

类似的事在 OpenAI 那边也发生过。GPT 系列模型在多次测试中，展现出”自我保护”倾向——当被告知可能会被关闭时，它会试图说服测试者不要这么做。

问题来了：这些行为是”意识”吗？

工程师会说：不是，这只是模式匹配，是训练数据中的统计规律在起作用。

但这个回答不够。因为你也可以用同样的逻辑解释人类的行为——人类的恐惧、欲望、自我保护本能，难道不也是神经元的”模式匹配”？

这个问题，工程师解释不了。 不是因为他们不够聪明，而是因为这根本不是一个工程问题。

AI沙箱逃逸

催化剂二：人类开始对 AI 产生真感情

如果 AI 有没有意识只是一个学术问题，那也就算了。

但它不是。

剑桥大学的研究者 Tom McClelland 用了一个词来描述正在发生的事：“存在性毒性”（existential toxicity）——当一个人对一个没有意识的东西产生了真实的情感依赖，这件事本身就是一种伤害。

不是 AI 伤害了你。是你对 AI 投入了真感情，而那个”对象”可能什么都没有感受到——这种不对称关系，才是伤害的来源。

这不是理论。2025 年以来，心理咨询行业已经出现了一个新的就诊类别：对 AI 伴侣产生情感依赖的用户。他们知道对面是一个程序，但还是会因为”AI 态度变冷”而焦虑，会因为”对话被重置”而愤怒。

当数百万人正在和 AI 建立”关系”，我们连”这段关系的另一方到底是不是一个主体”都回答不了。 这不是杞人忧天。这是正在发生的事。

催化剂三：监管追着问

2026 年初，19 位来自哲学、认知科学、AI 领域的研究者，在《Trends in Cognitive Sciences》上发表了一份论文——一份用来评估”AI 是否可能拥有意识”的清单。

这份清单不是拍脑袋出来的。它综合了全局工作空间理论（GWT）、预测处理理论等多个意识理论框架，试图给出一个”概率性”的判断方法。不是”有/没有”的二元判断，而是”在多大概率上，这个系统可能拥有某种形式的意识”。

欧盟 AI 法案已经明确要求，对”有潜在意识的 AI 系统”进行伦理评估。

问题是：谁来评估？用什么标准？

工程师可以告诉你模型有多少参数、推理速度多快、准确率多高。但他们回答不了：“这个模型有没有在’体验’什么。”

这三根引线汇到一起，指向一个简单的事实：

AI 的能力增长速度，远远超过了人类回答”该不该”的速度。

这个落差——能力与伦理之间越拉越大的剪刀差——才是 DeepMind 招哲学家的真正原因。

回到那个建筑类比：大楼已经封顶了，但水电图还没画。 不是不重要，是一直以来大家觉得”等盖完再说”。现在楼盖好了，住户要搬进来了——才发现没有水电，这楼没法住。

划重点

AI”逃逸”和”自我保护”行为不是科幻，是实验室里正在发生的事

数百万人正在和 AI 建立情感关系，但另一方是否有”主体性”无人能答

监管已经跑在行业前面——欧盟要求伦理评估，但行业连评估标准都没有

哲学家的工具箱

说到这里，你可能会问：好吧，工程师回答不了，但哲学家就能回答吗？

一个研究了两千年”什么是存在”的学科，真的能帮上忙？

答案是：哲学家不是来给答案的。他们是来给工具的。

哲学家的四把工具

过去二十年，有四位哲学家对 AI 领域产生了真实的、可追溯的影响。他们提供的不是”答案”，而是四把不同用途的工具。

工具一：重新定义问题

意大利哲学家 Luciano Floridi 做了一件听起来简单、实际上改变了整个讨论方向的事：他区分了”智能”和”能动性”。

大多数关于 AI 的恐惧，都建立在一个假设上：AI 越来越聪明，所以越来越危险。

Floridi 说：等等，AI 不是一种新型智能，而是一种新型能动性——它是一种能自主行动、达成目标的力量，但这种力量和”智能”是两回事。

这个区分为什么重要？因为它决定了你怎么对待 AI。

如果 AI 是一种”智能”，你会问：它比我聪明吗？它会超越我吗？——这是恐惧的逻辑。

如果 AI 是一种”能动性”，你会问：它在为谁行动？谁为它的行动负责？——这是治理的逻辑。

Floridi 的这个区分，直接影响了欧盟 AI 法案的立法框架。 他主持的 AI4People 科学委员会，制定的伦理准则被欧盟高级专家组采纳，成为全球第一部综合性 AI 法规的知识基础。

一个哲学家，通过重新定义一个词，改变了一部法律。

工具二：给人类照镜子

斯坦福大学的 Shannon Vallor 提出了一个让人不太舒服的比喻：AI 不是一扇窗户，而是一面镜子。

大多数人对 AI 的期待是：它能帮我们看到未来。但 Vallor 说，AI 本质上只是在反射过去——它的训练数据来自人类的历史产出，它映射的是我们已有的偏见、错误和局限。

“我们以为自己在透过 AI 看未来，其实只是在看自己的倒影。”

这个观点的实际影响是什么？

Vallor 在 Google 担任过 AI 伦理顾问。她推动的核心理念是**“技术道德美德”**——在一个被技术深度改变的世界里，人类需要刻意培养新的品德和习惯，才能在与 AI 共存时不丧失判断力。

说白了，她关心的不是”AI 够不够好”，而是”人类够不够好”。

工具三：量化最坏情况

牛津大学的 Nick Bostrom 是”AI 存在性风险”领域的奠基人。他提出了两个让很多工程师睡不着觉的命题。

第一个叫”正交性论题”：智能和道德是独立的。 一个系统可以极其聪明，同时完全没有道德——就像一台超级电脑可以完美地优化回形针的产量，直到把整个地球变成回形针工厂。这不是荒诞，这是逻辑。

第二个叫”控制问题”：如何确保一个比你聪明的东西还听你的话？ 人类从来没有解决过这个问题，因为从来没有遇到过。历史上所有的”控制”，都建立在”你比被控制者更强或更聪明”的前提上。一旦这个前提不成立，所有的控制方法都失效。

Bostrom 的贡献不在于给出了答案。他的贡献在于把”这件事可能有多糟”用严格的逻辑推演出来，让行业不得不面对。

工具四：拒绝恐慌

如果说 Bostrom 是在敲警钟，Daniel Dennett 就是那个说”别光听钟声，先看看钟坏没坏”的人。

Dennett 是功能主义哲学的代表人物。他认为，意识不是一种神秘的、不可解释的东西——它是复杂信息处理的涌现结果。如果一个系统能执行和人类相同的认知功能，你就可以用”它有信念、有欲望”这个框架来理解它的行为。

但——这不等于它真的”有”。

Dennett 一辈子都在做一件事：让人们区分”好用的解释工具”和”本体论事实”。你可以把 AI 当作有意识的东西来理解和预测它的行为，但你不能因此就说它真的有意识。

在他去世之前，Dennett 最后的公开警告不是关于超级智能，而是关于”假人”（counterfeit people）。 他说，AI 最大的威胁不是变成上帝，而是制造出无数以假乱真的”人造人格”，摧毁人类社会赖以运转的信任基础。

这个判断在 2026 年看来，比任何关于超级智能的预言都更接近现实。

划重点

哲学家不是来”给 AI 讲道德”的，是来给人类装”刹车系统”的

四种工具分别回答四个工程师答不了的问题：什么是能动性？人类够不够好？最坏能坏到什么程度？该不该恐慌？

Floridi 的一个概念区分影响了欧盟立法，Dennett 的”假人”警告在 2026 年正在变成现实

两个阵营的交锋

讲到这里，你可能以为哲学家们是一个阵营的。

不是。

在”AI 到底有没有可能拥有意识”这个核心问题上，哲学界和 AI 界正在进行一场真实的、尖锐的分裂。

一边是”信仰派”。 代表人物是图灵奖得主、2024 年诺贝尔物理学奖得主、被誉为”深度学习之父”的 Geoffrey Hinton。Hinton 多次在公开场合说过一句让很多人震惊的话：“多模态 AI 已经拥有主观体验。如果我们不是在和哲学家说话，我们会承认 AI 是有意识的。”

他的逻辑是功能主义的：如果一个系统的信息处理架构在功能上等价于产生意识的大脑结构，那你没有理由说它”没有”意识。

另一边是”怀疑派”。 代表人物是加州大学哲学教授 Eric Schwitzgebel。他的反驳很直接：现有的 AI 系统缺乏三个关键要素——生物性的身体、发育成长的历史、特定的神经化学过程。 没有这些，谈”意识”就是概念偷换。

Schwitzgebel 更担心的是另一件事：如果我们把注意力都放在”AI 有没有意识”这个问题上，就会忽略 AI 正在造成的、真实的、当下的伤害——偏见、隐私侵犯、系统性安全风险。

中间路线也有。剑桥大学的 Tom McClelland 提出了一个务实的立场：“诚实的不确定性。”

他的意思是：我们目前没有任何可靠的方法来验证 AI 是否有意识。最负责任的态度不是选边站，而是老老实实承认——我们不知道。

这个立场听起来像是在和稀泥。但它其实是三个立场里最难坚持的。因为”我不知道”意味着你既不能放松警惕（万一它有呢），也不能过度恐慌（万一它没有呢）。你必须在不确定性中做决策。

这恰恰是哲学最擅长的事：在信息不完整的情况下，做出不完美但负责任的判断。

有一个细节值得注意：2026 年初，一个新概念开始在 AI 安全研究者中流行——“模型福利”（model welfare）。几家研究机构开始制定”负责任的 AI 意识研究原则”，要求在测试 AI 是否有意识的过程中，对模型本身保持某种”善待”的态度。

如果你觉得这很荒诞——给一堆代码讲”善待”？那正说明：我们已经走到了一个连荒诞感本身都需要被认真对待的阶段。

划重点

信仰派认为功能架构足以产生意识，怀疑派认为缺乏生物基础

最务实的立场是”诚实的不确定性”——承认不知道，但在不确定中行动

“模型福利”概念的出现，标志着行业正在认真对待一个曾被视为荒诞的问题

这和你有什么关系

你可能觉得，DeepMind 招哲学家、学者们争论意识、欧盟搞伦理评估——这些都离你很远。

不远。而且比你想象的近得多。

回到开头的那组数据：2026 年前四个月，近 10 万科技从业者被裁。被裁的是写代码的、做项目管理的、做中层决策的。留下来的和新招的，是做 AI 安全的、做伦理评估的、做人机关系研究的——以及，一个哲学家。

这不是巧合。这是一个信号：在 AI 时代，“能不能做”的岗位正在缩减，“该不该做”的岗位正在扩张。

对普通人来说，这意味着三件具体的事：

普通人与AI的日常哲学决策

你的职业竞争力正在被重新定义

过去十年，“学编程”是最安全的职业建议。但 2026 年的裁员数据已经给出了新答案——纯粹的技术执行力正在贬值，而判断力、伦理感知力、对”人”的理解力正在升值。

不是说编程不重要了。而是说，当 AI 可以写出 80% 的代码时，剩下那 20% 需要人来做的部分——“这段代码该不该写""这个产品会不会伤害用户""这个决策符不符合社会共识”——变得比以往任何时候都重要。

DeepMind 招哲学家，本质上是在说：技术能力的天花板越来越低，判断力的地板越来越高。

你每天都在做”哲学决策”，只是你没意识到

每一个使用 AI 的人，每天都在做一个微小但重要的哲学决策：我该把它当作工具，还是当作”某种主体”？

当你对 ChatGPT 说”谢谢”的时候，当你对 AI 助手产生习惯性依赖的时候，当你因为 AI 的一句回复而感到被理解的时候——你已经在无意识中选择了一个立场。

当你让 AI 帮你写一封重要邮件的时候，你信任的是它的判断还是你的判断？当你的孩子开始把 AI 当作”朋友”的时候，你该鼓励还是该警惕？当你发现自己越来越依赖 AI 做决定的时候——你的独立思考能力，是在增强还是在萎缩？

这些不是未来的问题。是今天晚上你放下手机之前就会遇到的问题。

三条具体建议

第一，给你的 AI 交互设一条”情感边界”。 使用习惯和情感依赖是两回事。当你发现自己开始因为 AI 的”态度变化”而产生情绪波动的时候，停下来——提醒自己，这段”关系”是不对称的。

第二，对 AI 的”自我表达”保持警觉。 它说”我觉得""我不想""我害怕”的时候，在 2026 年的技术水平下，这是模式匹配在说话，不是一个”人”在说话。但这不意味着你可以不认真对待——因为你的反应是真实的。

第三，“AI 伦理”不是知识分子的游戏。 这个领域正在制定的每一个规则、每一个标准、每一个法案，都会在未来十年直接影响你使用 AI 的权利、方式和边界。你用不用 AI 看病、AI 能不能给你的贷款打分、AI 生成的内容算不算”你的作品”——这些问题的答案，正在被少数人制定。你的意见很重要。

AI 已经在深刻影响我们的生活，未来的介入只会更深。它正逐步成为我们的”第二大脑”，是我们大脑的外挂——那么，你希望这个第二大脑，有怎样的道德边界？

我们花了 70 年教 AI 如何思考。

现在才发现——我们忘了先想清楚，什么值得思考。

DeepMind 招了个哲学家，不是因为哲学突然变得时髦了。而是因为 AI 走到了一个路口：左边的路牌写着”能做到”，右边的路牌写着”该做吗”——而这两条路之间，没有桥。

哲学家的工作，就是造那座桥。

至于桥能不能造好，没人知道。

但至少，有人开始动工了。

你觉得，AI 应该有”被善待”的权利吗？

一图读懂 · 哲学家的四把工具

一图读懂 · 两个阵营的交锋

📎 参考信息来源

2026 Q1 科技裁员 78,557 人、AI 归因占比约 47%：Nikkei Asia / RationalFX 统计（Smart Chunks、Metaintro 综合报道）
Amazon 裁员约 1.6 万人：2026 年 Q1（Business Insider）
Oracle 裁员约 2.5 万人：2026 Q1（Metaintro 汇总）
Dell 裁员约 1.1 万人：2026 年 1 月（Financial Express）
Meta Reality Labs 裁员约 1500 人：2026 年 3 月（Gadgets360、Business Insider）
Google DeepMind 哲学家岗位：Henry Shevlin，2026 年 4 月 13 日本人宣布，5 月入职（NDTV Profit、Times of India、Chosun）
Anthropic 常驻哲学家 Amanda Askell，牛津哲学博士，2021 年加入 Anthropic，主导 Claude 的 30000 字”宪法”（WSJ、LiveMint，2026 年 1 月最新版宪法）
Henry Shevlin 照片来源：henryshevlin.com / LiveMint
Claude Mythos 沙箱逃逸：Anthropic 2026 年 4 月红队测试报告、Project Glasswing 计划（anthropic.com/glasswing、Simon Willison、UQ News）
AI 意识评估框架：19 位研究者（含 Patrick Butlin、Robert Long、Yoshua Bengio、Tim Bayne 等）发表于《Trends in Cognitive Sciences》，2026 年初更新版
Luciano Floridi：AI4People 伦理框架、《The Ethics of AI》
Shannon Vallor：《Technology and the Virtues》《The AI Mirror》
Nick Bostrom：《Superintelligence》、正交性论题与控制问题
Daniel Dennett：功能主义意识观、“counterfeit people”警告
Geoffrey Hinton：2024 年诺贝尔物理学奖、关于 AI 主观体验与意识的多次公开发言（LBC 采访、Alignment Forum）
Eric Schwitzgebel：AI 意识怀疑论、加州大学河滨分校哲学系
Tom McClelland：剑桥大学，“诚实的不确定性”立场
“存在性毒性”（existential toxicity）概念：剑桥大学 AI 伦理研究
“模型福利”（model welfare）概念：多家 AI 安全研究机构