叁笙早安 AI
首页 · 深度文章 · 给 Claude Code 装个搜索 MCP:AnySearch VS Tavily 横向对比
教程 MCP效率工具

给 Claude Code 装个搜索 MCP:AnySearch VS Tavily 横向对比

叁笙 2026-05-19 25 分钟阅读 公众号原文 ↗
给 Claude Code 装个搜索 MCP:AnySearch VS Tavily 横向对比
心的尺
🎵 本文主题曲 · 心的尺
0:00
0:00

给 Claude Code 装个搜索 MCP:AnySearch VS Tavily 横向对比

你用 AI Agent 联网查过东西吗? 豆包、ChatGPT、Claude,现在都能”边查边答”。这个能力有个统一的名字,叫 Web research — 让模型自己上网搜,再根据搜到的东西回答你。

听起来很美。但你有没有想过:Agent 上网这一步,到底是怎么搜的?

绝大多数 Agent 的默认 Web research,干的是同一件事:调一个通用搜索接口(本质就是 Bing、Google 那套),抓回前几条网页摘要,塞给模型。这套东西是给人设计的 — 人会自己点链接、自己分辨哪条靠谱、自己跳过广告。可 Agent 不会。它只能把抓回来的一堆聚合站、营销软文、过期传闻照单全收,再一本正经地拿这些回答你。

所以你常觉得 Agent 查东西**“又浅又杂”,多半不怪模型笨,怪它那双默认的”眼睛”太将就。**

那有没有专门给 Agent 用的搜索? 有。这类服务叫”搜索 MCP” — 你可以理解成给 Agent 装的一个”搜索外挂”。它不丢网页摘要让 Agent 自己啃,而是把结果整理成干净、结构化、能直接用的答案,还能伸到普通搜索够不着的专业数据库里。

差距有多大? 这篇我把两个搜索 MCP 拉到同一台机器上真机对测了一轮 — 一个是很多人 Agent 里在跑的老将 Tavily,一个是刚发布 8 天的新玩家 AnySearch。结果一边倒到 14:1

但先别急着冲。这篇不吹不黑:先讲清你到底该不该给 Agent 装这东西,再看这俩怎么选,最后告诉你它没说的 6 件事


先说清楚,这到底是个什么东西

开篇说的”搜索 MCP”,到底是个啥?

MCP 是现在 Claude、Cursor 这类 Agent 工具通用的”插件接口”。装一个 MCP,就等于给 Agent 多接一项能力 — 接个搜索 MCP,它就把那双将就的默认”眼睛”换成了专业的。除 MCP 外,这类服务一般还给 Skill、API 两种接法,名字别被吓到,对绝大多数人来说记住 MCP 这一种就够

这条赛道不止一家。Tavily 是先行者,做了几年,很多人 Agent 里那行联网搜索就是它;AnySearch 是上周才冒头的新人。今天就看这两位 — 到底差在哪、你该选谁。

划重点

  • 普通 Agent 默认的 Web research = “通用搜索抓摘要”,对人够用、对 Agent 将就
  • 搜索 MCP = 给 Agent 装的专业搜索外挂,出结构化、能直接用的答案
  • 主流接法记 MCP 一种就够;赛道里 Tavily 老将、AnySearch 新人

AnySearch 是谁,它给了什么又藏了什么

先看脸。

AnySearch 官网首页

官网做得很体面,一句”致每一位关注 AI 未来的朋友”,配水彩插画,气质拉满。但体面是设计师的活儿,我们要看的是体面背后有没有人。

它从哪来,谁在做

AnySearch 在 2026 年 5 月 11 日通过一纸新闻通稿正式发布,发布地署名香港。算到今天,上线满打满算 8 天。这是一个还在产房里的产品 — 不是缺点,但是前提:你后面看到的一切,都要放在”它才 8 天大”这个背景下读。

谁做的? 官网认认真真做了个”我们的团队”页。

AnySearch 团队页

四位联合创始人:Guanqun 是 CEO,莫克里是 CTO,授予是 VPE,艾登是 CISO。职位齐整,头像精致。

但你发现哪儿不对了吗?

全是花名,配卡通头像。 没有真名,没有领英,没有过往履历,没有融资信息,查不到注册公司实体。通稿里所有的话,都署名”AnySearch 团队说”,没有一个具名的人站出来。

这不是道德审判。我说清楚我的态度:一个 8 天的初创,团队信息不全,太正常了。我只是在陈述一个事实 — 它给了你一张脸,但没给你身份证。 这件事先记着,后面有用。

怎么装,怎么用

接入这块,AnySearch 是真下了功夫的,体验确实顺。

AnySearch MCP 安装方式

它的 MCP 安装,几乎做到了”傻瓜化”:复制一句提示词,发给你的 Agent,它自己就装好了。不用你去抠配置文件,不用你懂什么是 Streamable HTTP。对不想折腾的人,这一步的门槛被压得很低。

API 那边也清爽:后台一键建密钥,复制就能用。

AnySearch API 密钥管理

还配了用量看板,调用次数、成功率、平均响应时间、调用趋势,一眼能看明白。

AnySearch 用量统计面板

它覆盖 22 个垂直领域,不登录也能用(限速更严)。当前还给所有用户每天 1000 次免费调用 — 但请注意,官方原话用的词是 “currently”(当前)。这是促销期的说法,长期到底怎么收费、单价多少,官网连个定价页都没有。所以别把”1000 次免费”当成长期承诺,它更像是开业大酬宾。

它自己晒的成绩单

接下来这段,是全文最需要你戴着眼镜看的部分。

AnySearch 官方主张:在 Frames、FreshQA、WebWalkerQA 三个数据集上,准确率 76.4%,端到端 47.8 秒,真实场景评分把 Brave、Parallel 按在地上摩擦。

数字很漂亮。但每一个都要加注释:

第一,这些 benchmark 全是它自己测的,而且打分的不是人,是另一个 AI 模型(官网标注用 Claude Opus 4.6 给生成内容打分)。自己出题、自己答题、再请个 AI 当裁判 — 不是说一定不可信,是说这种成绩单和”第三方独立复现”完全是两回事。

第二,那个”47.8 秒”,是 Agent 完成整件任务的端到端耗时,不是搜一次要 47 秒。别被这个数字误导。

第三,关于”开源”。它的 GitHub 上确实有仓库,但你点进去会发现:开源的只是客户端脚本和 Skill 包,真正干活的那个搜索引擎,是闭源的云服务。这跟”这个产品开源”是两个意思。

新工具最响的那串数字,往往是它自己打的分。

这不是说 AnySearch 在骗人。它的成绩单也许是真的。我想说的是:在它自己晒的数字和别人验过的数字之间,隔着一条你必须看见的缝。

划重点

  • 发布于 2026-05-11,上线约 8 天,极早期,所有评价都要放进这个前提
  • 团队页 4 位联创全是花名+卡通头像,无真名/履历/融资/实体 — 给了脸没给身份证
  • 接入体验确实顺:MCP 一句话装好,API 一键建密钥,有用量看板
  • “1000 次/天免费”是促销期说法,无公开定价页;自报性能全是自测+AI自评,“开源”仅指客户端

判断一个刚出生的工具,就看三件事

你可能想问:那它在 GitHub、在社区口碑怎么样? 我帮你查过了。

截至发稿,没有任何独立第三方评测。没有 Product Hunt 页面,没有 Hacker News 讨论,中文世界里一篇正经测评都没有。你能搜到的那些科技媒体”报道”,扒开看,几乎全是把那纸新闻通稿原文转载了一遍。

所以这一节我不打算给你编一个口碑出来。比口碑更值钱的,是一把你以后遇到任何新工具都能复用的尺子。

判断一个刚出生的 AI 工具靠不靠谱,就看三件事:

一看谁做的。 团队是谁,公司是谁,钱从哪来,透不透明? 透明,加分;藏着,存疑。拿 AnySearch 套:有团队页,但全是花名 — 🟡 半透明,存疑。

二看数字谁打的。 它晒的性能,是第三方独立测出来的,还是自己测、自己评的? 第三方,可信度高;自测自评,打个折。拿 AnySearch 套:自测 + AI 自评 — ⚠️ 要打折。

三看口碑哪来的。 网上的好评,是真实用户用出来的,还是通稿复制粘贴出来的? 真实用户,参考;通稿转载,无效。拿 AnySearch 套:截至发稿全是通稿 — ⚠️ 暂无有效口碑。

这三看,文末有一张图替你记住。

三件事,AnySearch 现在一个绿灯都没有,全是黄灯橙灯。这意味着它是骗局吗? 不。这意味着它还没被验证过。新和差,是两件事;没被验证和不行,也是两件事。

判断一个新 AI 工具,不看它说自己多强,看它敢不敢让别人来验证。

它没让别人验。那行,我们就来当这个”别人”。

划重点

  • 截至发稿:无独立评测、无 PH/HN/中文测评,媒体”报道”几乎全是通稿转载
  • 三看法则:一看谁做的、二看数字谁打的、三看口碑哪来的
  • AnySearch 当前三项全是黄/橙灯 — 不是不行,是没被验证过

我们真机对测了一轮

口说无凭。我在本机同一套环境里把两个 MCP 都装上,2026 年 5 月 19 日跑了一轮盲评对测:通用 16 题两边都用普通模式、参数对齐;再加 12 道垂直专项题,看 AnySearch 的垂直模式能不能拉开差距。

先说清楚:这是我自己搭的实测,不是官方对决,别当成厂商互掐 — 拉它俩同台,只因为它俩在很多人的 Agent 里是真实的二选一。

通用场景:AnySearch 14 : 1 大胜

逐题打下来,AnySearch 14 胜、Tavily 1 胜、1 平。八个维度的评分,差距是结构性的:

维度TavilyAnySearch
相关性3.894.87
时效性3.134.03
信源权威性3.554.21
覆盖多样性3.793.74
准确性*3.184.45
中文支持3.864.86
内容丰富度3.924.87
噪声去重3.264.18
加权总分3.564.38

核心区别就藏在这张表里:Tavily 给的是”一堆相关网页”,AnySearch 给的是”一手、干净、可直接用的答案”。查”OpenAI 最新模型”,AnySearch 前六条几乎全是 openai.com 一手发布页 + TechCrunch;Tavily 多是聚合站,还混进一条过期传闻。中文和时效性内容上这个差距尤其明显 — 这是日常用 Agent 查资料的人最该在意的一栏。

(Tavily 唯一那 1 胜,是”查它自己家文档”,主场不算数。准确性那列标 * 是 AI 跨源一致性判断的软指标,别当铁律。)

垂直场景:各有地盘,别一刀切

考 AnySearch 垂直模式时,它 8 胜、Tavily 4 胜 — 没有一边倒,恰恰说明两者根本不是同一种工具:

维度Tavily-通用AnySearch-垂直
答案直达3.34.0
相关性4.03.9
信源权威3.34.6
准确性*3.84.0
丰富度2.93.8
噪声去重3.23.0

AnySearch 的真本事在”专业库直答”:学术、安全、专利、代码文档这四类它全胜 — 直接吐 DOI、PMID、VirusTotal 命中数、专利号带分类、官方文档原文。这是 Tavily”抓公开网页”那条路结构上做不到的。

但它也有翻车的地方:金融实时报价、农业产量这两类明显退化 — 你问实时报价它给你衍生品页面。覆盖到的地方很强,没覆盖到的地方是空的,反不如老老实实抓网页的 Tavily。速度上两者几乎打平(端到端 AnySearch 方向性快约 7%,但不是精确指标)。

所以两者的根本区别一句话讲完:Tavily 是”什么都能搜一点的通用网页搜索”,AnySearch 是”通用更强 + 在它覆盖好的专业领域能直答”。 通用查询和中文时效内容、以及学术/安全/专利/代码这几类,选 AnySearch;金融实时、它没覆盖的冷门垂类,留 Tavily。

但有 6 件事,它没告诉你

如果只把上面的比分甩给你,这篇就成软广了。这六条缺一条都不诚实:

一、对 AnySearch 其实是手下留情的 — 通用那 14:1,是它只用普通模式、垂直能力没计入打出来的。 二、单轮快照 — 只测了 5 月 19 日这一天,没重复跑,搜索结果天天变,换天比分会漂。 三、这轮 Tavily 是满状态 — 本机有时撞它的限流,这次恰好没撞上,对它有利。 四、垂直覆盖很不均 — security 域只能做信誉扫描、不支持按 CVE 查漏洞,environment 域没有天气只有农业数据。 五、“准确性”是软指标 — 那列分是 AI 跨源一致性判断,不是人工独立核实。 六、检索到的内容 ≠ 事实 — 对测里两边都返回过”某模型 100 万上下文""每百万 token 多少钱”这类说法,那只是它俩搜到的网页内容,不是我替你核实过的事实。搜索引擎负责找回来,判断真假仍是你的事,模型版本与价格请以官网为准。

它没让别人验,那我们就替你验了一轮 — 结论是:能打,但别拿单轮当定论。

划重点

  • 通用场景 AnySearch 14:1 大胜(加权 4.38 vs 3.56),中文/时效尤其强
  • 根本区别:Tavily=通用网页搜索;AnySearch=通用更强+专业库能直答(学术/安全/专利/代码)
  • AnySearch 弱在覆盖不均(金融实时/冷门垂类退化),这几类继续用 Tavily
  • 6 条诚实底牌:手下留情、单轮快照、Tavily 满状态、覆盖不均、软指标、检索≠事实

所以,你到底该不该用它

不分人群的建议都是耍流氓。分三种人说。

如果你只是用豆包、ChatGPT 这类聊天 AI,没真正跑过 Agent。 现在不用碰。你知道”有这么个东西,能给 Agent 加搜索能力”就够了。等它长大,等三看法则亮几个绿灯,再说。现在去折腾它,性价比不高。

如果你是已经在跑 Agent 的玩家。 值得拿免费额度试一把 — 特别是你常做学术检索、安全情报、专利、代码文档这几类活,AnySearch 垂直模式给的直答,是 Tavily 结构上给不了的,这点实测撑得住。但有个红线:别现在就把生产链路压上去。 理由就是三看法则那三盏没亮的灯 — 一个还没被任何人独立验证过、团队只露花名的服务,可以当备选,不该当地基。

如果你的场景重度依赖搜索。 别”二选一”,按 PART4 那句话分场景用就行 — 工具没有”哪个更好”,只有”这个场景该用哪个”。真正要记住的是:哪怕它这轮赢得漂亮,也只是一轮。

说回开头:你那双将就的默认”眼睛”,到底要不要换?

我的答案是 — 该换,但先让新的当备用,别急着把用惯的那只摘下来。它这次实测确实打得漂亮,漂亮到我想多看它几眼;可漂亮和可靠之间,隔着的正是那 6 件它没说的事,和三看法则里还没亮的那几盏灯。

新工具的数字可以自测,但你的信任不能自测。

AI 工具现在一周冒出来一打。能不能不错过好东西,又不当那只小白鼠,靠的不是运气,是你手里那把尺子。AnySearch 只是今天这把尺子量到的第一个。下一个新工具来的时候 — 它一定会来 — 你已经知道该看哪三件事了。


你会把 Agent 的眼睛,交给一个刚出生 8 天、只露了花名的服务吗? 评论区聊聊你的判断。

📎 信息来源

AnySearch 发布通稿 PR Newswire,2026-05-11,标题 AnySearch Launches as Search Infrastructure Built for AI Agents

AnySearch 官网与文档 anysearch.com 首页 / docs / 团队页 / 控制台,截至 2026-05-19

AnySearch 官方 GitHub github.com/anysearch-ai(anysearch-skill / anysearch-mcp-server,均为客户端,核心引擎闭源)

第三方独立加工 Let’s Data Science,AnySearch Launches Search Infrastructure for AI Agents(转述官网 benchmark 并提出第三方复现/定价/审计三点质疑)

Tavily 局限侧证 Medium,Tavily Alternatives in 2026 After the Nebius Acquisition(讲 Tavily web-only 局限,未提及 AnySearch)

AnySearch×Tavily 真机实测 本机同环境双 MCP 盲评,2026-05-19 单轮快照(通用 16 题 + 垂直 12 题,原始数据见作者留存)

说明 文中 AnySearch 性能数字均为厂商自测 + AI 自评,未经独立验证;实测结论为作者单轮快照,非官方对决;涉及的模型版本/价格为搜索引擎返回的网页内容,非已核实事实,请以各厂商官网为准

← 返回深度文章