首页 · 深度文章 · 给 Claude Code 装个搜索 MCP：AnySearch VS Tavily 横向对比

教程 MCP效率工具

给 Claude Code 装个搜索 MCP：AnySearch VS Tavily 横向对比

叁笙 2026-05-19 25 分钟阅读公众号原文 ↗

🎵 本文主题曲 · 心的尺

0:00

给 Claude Code 装个搜索 MCP：AnySearch VS Tavily 横向对比

你用 AI Agent 联网查过东西吗? 豆包、ChatGPT、Claude，现在都能”边查边答”。这个能力有个统一的名字，叫 Web research — 让模型自己上网搜，再根据搜到的东西回答你。

听起来很美。但你有没有想过：Agent 上网这一步，到底是怎么搜的?

绝大多数 Agent 的默认 Web research，干的是同一件事：调一个通用搜索接口（本质就是 Bing、Google 那套），抓回前几条网页摘要，塞给模型。这套东西是给人设计的 — 人会自己点链接、自己分辨哪条靠谱、自己跳过广告。可 Agent 不会。它只能把抓回来的一堆聚合站、营销软文、过期传闻照单全收，再一本正经地拿这些回答你。

所以你常觉得 Agent 查东西**“又浅又杂”，多半不怪模型笨，怪它那双默认的”眼睛”太将就。**

那有没有专门给 Agent 用的搜索? 有。这类服务叫”搜索 MCP” — 你可以理解成给 Agent 装的一个”搜索外挂”。它不丢网页摘要让 Agent 自己啃，而是把结果整理成干净、结构化、能直接用的答案，还能伸到普通搜索够不着的专业数据库里。

差距有多大? 这篇我把两个搜索 MCP 拉到同一台机器上真机对测了一轮 — 一个是很多人 Agent 里在跑的老将 Tavily，一个是刚发布 8 天的新玩家 AnySearch。结果一边倒到 14:1。

但先别急着冲。这篇不吹不黑：先讲清你到底该不该给 Agent 装这东西，再看这俩怎么选，最后告诉你它没说的 6 件事。

先说清楚，这到底是个什么东西

开篇说的”搜索 MCP”，到底是个啥?

MCP 是现在 Claude、Cursor 这类 Agent 工具通用的”插件接口”。装一个 MCP，就等于给 Agent 多接一项能力 — 接个搜索 MCP，它就把那双将就的默认”眼睛”换成了专业的。除 MCP 外，这类服务一般还给 Skill、API 两种接法，名字别被吓到，对绝大多数人来说记住 MCP 这一种就够。

这条赛道不止一家。Tavily 是先行者，做了几年，很多人 Agent 里那行联网搜索就是它；AnySearch 是上周才冒头的新人。今天就看这两位 — 到底差在哪、你该选谁。

划重点

普通 Agent 默认的 Web research = “通用搜索抓摘要”，对人够用、对 Agent 将就

搜索 MCP = 给 Agent 装的专业搜索外挂，出结构化、能直接用的答案

主流接法记 MCP 一种就够；赛道里 Tavily 老将、AnySearch 新人

AnySearch 是谁，它给了什么又藏了什么

先看脸。

AnySearch 官网首页

官网做得很体面，一句”致每一位关注 AI 未来的朋友”，配水彩插画，气质拉满。但体面是设计师的活儿，我们要看的是体面背后有没有人。

它从哪来，谁在做

AnySearch 在 2026 年 5 月 11 日通过一纸新闻通稿正式发布，发布地署名香港。算到今天，上线满打满算 8 天。这是一个还在产房里的产品 — 不是缺点，但是前提：你后面看到的一切，都要放在”它才 8 天大”这个背景下读。

谁做的? 官网认认真真做了个”我们的团队”页。

AnySearch 团队页

四位联合创始人：Guanqun 是 CEO，莫克里是 CTO，授予是 VPE，艾登是 CISO。职位齐整，头像精致。

但你发现哪儿不对了吗?

全是花名，配卡通头像。 没有真名，没有领英，没有过往履历，没有融资信息，查不到注册公司实体。通稿里所有的话，都署名”AnySearch 团队说”，没有一个具名的人站出来。

这不是道德审判。我说清楚我的态度：一个 8 天的初创，团队信息不全，太正常了。我只是在陈述一个事实 — 它给了你一张脸，但没给你身份证。 这件事先记着，后面有用。

怎么装，怎么用

接入这块，AnySearch 是真下了功夫的，体验确实顺。

AnySearch MCP 安装方式

它的 MCP 安装，几乎做到了”傻瓜化”：复制一句提示词，发给你的 Agent，它自己就装好了。不用你去抠配置文件，不用你懂什么是 Streamable HTTP。对不想折腾的人，这一步的门槛被压得很低。

API 那边也清爽：后台一键建密钥，复制就能用。

AnySearch API 密钥管理

还配了用量看板，调用次数、成功率、平均响应时间、调用趋势，一眼能看明白。

AnySearch 用量统计面板

它覆盖 22 个垂直领域，不登录也能用（限速更严）。当前还给所有用户每天 1000 次免费调用 — 但请注意，官方原话用的词是 “currently”（当前）。这是促销期的说法，长期到底怎么收费、单价多少，官网连个定价页都没有。所以别把”1000 次免费”当成长期承诺，它更像是开业大酬宾。

它自己晒的成绩单

接下来这段，是全文最需要你戴着眼镜看的部分。

AnySearch 官方主张：在 Frames、FreshQA、WebWalkerQA 三个数据集上，准确率 76.4%，端到端 47.8 秒，真实场景评分把 Brave、Parallel 按在地上摩擦。

数字很漂亮。但每一个都要加注释：

第一，这些 benchmark 全是它自己测的，而且打分的不是人，是另一个 AI 模型（官网标注用 Claude Opus 4.6 给生成内容打分）。自己出题、自己答题、再请个 AI 当裁判 — 不是说一定不可信，是说这种成绩单和”第三方独立复现”完全是两回事。

第二，那个”47.8 秒”，是 Agent 完成整件任务的端到端耗时，不是搜一次要 47 秒。别被这个数字误导。

第三，关于”开源”。它的 GitHub 上确实有仓库，但你点进去会发现：开源的只是客户端脚本和 Skill 包，真正干活的那个搜索引擎，是闭源的云服务。这跟”这个产品开源”是两个意思。

新工具最响的那串数字，往往是它自己打的分。

这不是说 AnySearch 在骗人。它的成绩单也许是真的。我想说的是：在它自己晒的数字和别人验过的数字之间，隔着一条你必须看见的缝。

划重点

发布于 2026-05-11，上线约 8 天，极早期，所有评价都要放进这个前提

团队页 4 位联创全是花名+卡通头像，无真名/履历/融资/实体 — 给了脸没给身份证

接入体验确实顺：MCP 一句话装好，API 一键建密钥，有用量看板

“1000 次/天免费”是促销期说法，无公开定价页；自报性能全是自测+AI自评，“开源”仅指客户端

判断一个刚出生的工具，就看三件事

你可能想问：那它在 GitHub、在社区口碑怎么样? 我帮你查过了。

截至发稿，没有任何独立第三方评测。没有 Product Hunt 页面，没有 Hacker News 讨论，中文世界里一篇正经测评都没有。你能搜到的那些科技媒体”报道”，扒开看，几乎全是把那纸新闻通稿原文转载了一遍。

所以这一节我不打算给你编一个口碑出来。比口碑更值钱的，是一把你以后遇到任何新工具都能复用的尺子。

判断一个刚出生的 AI 工具靠不靠谱，就看三件事：

一看谁做的。 团队是谁，公司是谁，钱从哪来，透不透明? 透明，加分；藏着，存疑。拿 AnySearch 套：有团队页，但全是花名 — 🟡 半透明，存疑。

二看数字谁打的。 它晒的性能，是第三方独立测出来的，还是自己测、自己评的? 第三方，可信度高；自测自评，打个折。拿 AnySearch 套：自测 + AI 自评 — ⚠️ 要打折。

三看口碑哪来的。 网上的好评，是真实用户用出来的，还是通稿复制粘贴出来的? 真实用户，参考；通稿转载，无效。拿 AnySearch 套：截至发稿全是通稿 — ⚠️ 暂无有效口碑。

这三看，文末有一张图替你记住。

三件事，AnySearch 现在一个绿灯都没有，全是黄灯橙灯。这意味着它是骗局吗? 不。这意味着它还没被验证过。新和差，是两件事；没被验证和不行，也是两件事。

判断一个新 AI 工具，不看它说自己多强，看它敢不敢让别人来验证。

它没让别人验。那行，我们就来当这个”别人”。

划重点

截至发稿：无独立评测、无 PH/HN/中文测评，媒体”报道”几乎全是通稿转载

三看法则：一看谁做的、二看数字谁打的、三看口碑哪来的

AnySearch 当前三项全是黄/橙灯 — 不是不行，是没被验证过

我们真机对测了一轮

口说无凭。我在本机同一套环境里把两个 MCP 都装上，2026 年 5 月 19 日跑了一轮盲评对测：通用 16 题两边都用普通模式、参数对齐；再加 12 道垂直专项题，看 AnySearch 的垂直模式能不能拉开差距。

先说清楚：这是我自己搭的实测，不是官方对决，别当成厂商互掐 — 拉它俩同台，只因为它俩在很多人的 Agent 里是真实的二选一。

通用场景：AnySearch 14 : 1 大胜

逐题打下来，AnySearch 14 胜、Tavily 1 胜、1 平。八个维度的评分，差距是结构性的：

维度	Tavily	AnySearch
相关性	3.89	4.87
时效性	3.13	4.03
信源权威性	3.55	4.21
覆盖多样性	3.79	3.74
准确性*	3.18	4.45
中文支持	3.86	4.86
内容丰富度	3.92	4.87
噪声去重	3.26	4.18
加权总分	3.56	4.38

核心区别就藏在这张表里：Tavily 给的是”一堆相关网页”，AnySearch 给的是”一手、干净、可直接用的答案”。查”OpenAI 最新模型”，AnySearch 前六条几乎全是 openai.com 一手发布页 + TechCrunch；Tavily 多是聚合站，还混进一条过期传闻。中文和时效性内容上这个差距尤其明显 — 这是日常用 Agent 查资料的人最该在意的一栏。

（Tavily 唯一那 1 胜，是”查它自己家文档”，主场不算数。准确性那列标 * 是 AI 跨源一致性判断的软指标，别当铁律。）

垂直场景：各有地盘，别一刀切

考 AnySearch 垂直模式时，它 8 胜、Tavily 4 胜 — 没有一边倒，恰恰说明两者根本不是同一种工具：

维度	Tavily-通用	AnySearch-垂直
答案直达	3.3	4.0
相关性	4.0	3.9
信源权威	3.3	4.6
准确性*	3.8	4.0
丰富度	2.9	3.8
噪声去重	3.2	3.0

AnySearch 的真本事在”专业库直答”：学术、安全、专利、代码文档这四类它全胜 — 直接吐 DOI、PMID、VirusTotal 命中数、专利号带分类、官方文档原文。这是 Tavily”抓公开网页”那条路结构上做不到的。

但它也有翻车的地方：金融实时报价、农业产量这两类明显退化 — 你问实时报价它给你衍生品页面。覆盖到的地方很强，没覆盖到的地方是空的，反不如老老实实抓网页的 Tavily。速度上两者几乎打平（端到端 AnySearch 方向性快约 7%，但不是精确指标）。

所以两者的根本区别一句话讲完：Tavily 是”什么都能搜一点的通用网页搜索”，AnySearch 是”通用更强 + 在它覆盖好的专业领域能直答”。 通用查询和中文时效内容、以及学术/安全/专利/代码这几类，选 AnySearch；金融实时、它没覆盖的冷门垂类，留 Tavily。

但有 6 件事，它没告诉你

如果只把上面的比分甩给你，这篇就成软广了。这六条缺一条都不诚实：

一、对 AnySearch 其实是手下留情的 — 通用那 14:1，是它只用普通模式、垂直能力没计入打出来的。 二、单轮快照 — 只测了 5 月 19 日这一天，没重复跑，搜索结果天天变，换天比分会漂。 三、这轮 Tavily 是满状态 — 本机有时撞它的限流，这次恰好没撞上，对它有利。 四、垂直覆盖很不均 — security 域只能做信誉扫描、不支持按 CVE 查漏洞，environment 域没有天气只有农业数据。 五、“准确性”是软指标 — 那列分是 AI 跨源一致性判断，不是人工独立核实。 六、检索到的内容 ≠ 事实 — 对测里两边都返回过”某模型 100 万上下文""每百万 token 多少钱”这类说法，那只是它俩搜到的网页内容，不是我替你核实过的事实。搜索引擎负责找回来，判断真假仍是你的事，模型版本与价格请以官网为准。

它没让别人验，那我们就替你验了一轮 — 结论是：能打，但别拿单轮当定论。

划重点

通用场景 AnySearch 14:1 大胜（加权 4.38 vs 3.56），中文/时效尤其强

根本区别：Tavily=通用网页搜索；AnySearch=通用更强+专业库能直答（学术/安全/专利/代码）

AnySearch 弱在覆盖不均（金融实时/冷门垂类退化），这几类继续用 Tavily

6 条诚实底牌：手下留情、单轮快照、Tavily 满状态、覆盖不均、软指标、检索≠事实

所以，你到底该不该用它

不分人群的建议都是耍流氓。分三种人说。

如果你只是用豆包、ChatGPT 这类聊天 AI，没真正跑过 Agent。 现在不用碰。你知道”有这么个东西，能给 Agent 加搜索能力”就够了。等它长大，等三看法则亮几个绿灯，再说。现在去折腾它，性价比不高。

如果你是已经在跑 Agent 的玩家。 值得拿免费额度试一把 — 特别是你常做学术检索、安全情报、专利、代码文档这几类活，AnySearch 垂直模式给的直答，是 Tavily 结构上给不了的，这点实测撑得住。但有个红线：别现在就把生产链路压上去。 理由就是三看法则那三盏没亮的灯 — 一个还没被任何人独立验证过、团队只露花名的服务，可以当备选，不该当地基。

如果你的场景重度依赖搜索。 别”二选一”，按 PART4 那句话分场景用就行 — 工具没有”哪个更好”，只有”这个场景该用哪个”。真正要记住的是：哪怕它这轮赢得漂亮，也只是一轮。

说回开头：你那双将就的默认”眼睛”，到底要不要换?

我的答案是 — 该换，但先让新的当备用，别急着把用惯的那只摘下来。它这次实测确实打得漂亮，漂亮到我想多看它几眼；可漂亮和可靠之间，隔着的正是那 6 件它没说的事，和三看法则里还没亮的那几盏灯。

新工具的数字可以自测，但你的信任不能自测。

AI 工具现在一周冒出来一打。能不能不错过好东西，又不当那只小白鼠，靠的不是运气，是你手里那把尺子。AnySearch 只是今天这把尺子量到的第一个。下一个新工具来的时候 — 它一定会来 — 你已经知道该看哪三件事了。

你会把 Agent 的眼睛，交给一个刚出生 8 天、只露了花名的服务吗? 评论区聊聊你的判断。

📎 信息来源

AnySearch 发布通稿 PR Newswire，2026-05-11，标题 AnySearch Launches as Search Infrastructure Built for AI Agents

AnySearch 官网与文档 anysearch.com 首页 / docs / 团队页 / 控制台，截至 2026-05-19

AnySearch 官方 GitHub github.com/anysearch-ai（anysearch-skill / anysearch-mcp-server，均为客户端，核心引擎闭源）

第三方独立加工 Let’s Data Science，AnySearch Launches Search Infrastructure for AI Agents（转述官网 benchmark 并提出第三方复现/定价/审计三点质疑）

Tavily 局限侧证 Medium，Tavily Alternatives in 2026 After the Nebius Acquisition（讲 Tavily web-only 局限，未提及 AnySearch）

AnySearch×Tavily 真机实测 本机同环境双 MCP 盲评，2026-05-19 单轮快照（通用 16 题 + 垂直 12 题，原始数据见作者留存）

说明文中 AnySearch 性能数字均为厂商自测 + AI 自评，未经独立验证；实测结论为作者单轮快照，非官方对决；涉及的模型版本/价格为搜索引擎返回的网页内容，非已核实事实，请以各厂商官网为准