构建 AI 的公司和评估 AI 的公司,现在的流量与 AI 产品本身一样大。
百万俱乐部 — 研究与数据科学版。这是排名背后的排名。出现在其他百万俱乐部文章中的每一个 AI 聊天机器人、图像生成器和编码工具,都是由研究实验室构建,在标记数据上训练,并在出现在此列表中的基准上进行评估的。这就是智能本身的供应链。
这里的惊喜是结构性的。SAP — 是的,那家企业软件公司 — 以其 AI 平台近 3900 万的月访问量领先。Google 分散在四个研究领域,总计 4500 万。大多数人从未听说过的数据标记公司 — Outlier, Prolific, Data Annotation — 总共吸引了超过 4000 万次访问。而 LMSys Arena 以 2500 万的访问量已成为比较 AI 模型的事实标准,其产生的流量比它评估的大多数模型都要多。
我追踪了跨越 AI 研究实验室、数据基础设施、标记服务、基准测试和研究社区的 42 个平台。其中 29 个提供免费访问。有四个条目的访问量低于 100 万,但因其对 AI 生态系统的巨大影响力而被收录。所有数字均来自 SimilarWeb,反映了 2025 年 12 月的估算值。我计划在每月 22 日左右更新这些数据。
完整排名
这是按月流量排名的所有 42 个 AI 研究和数据科学平台。这是该系列中最异构的排名 — 研究实验室紧挨着数据标记市场,云平台紧挨着学术论文审查网站。将它们联系在一起的是它们在 AI 供应链中的角色:构建模型、训练模型、评估模型,或提供部署模型的基础设施。42 个平台中有 29 个提供免费访问。
| # | 域名 | 月访问量 | 服务 | 免费 |
|---|---|---|---|---|
🥇 | ondemand.com | 38.87M | SAP BTP AI 平台 | |
🥈 | labs.google | 34.22M | Google AI 实验 | |
🥉 | x.ai | 32.83M | xAI 公司官网 | |
#4 | qwen.ai | 32.76M | 阿里通义千问官网 | |
#5 | aliyun.com | 29.05M | 阿里云 AI 服务 | |
#6 | lmarena.ai | 25.33M | LMSys Arena AI 模型评估 | |
#7 | outlier.ai | 21M | Outlier AI 数据分析 | |
#8 | cloud.sap | 14.27M | SAP AI 平台 | |
#9 | prolific.com | 13.32M | Prolific AI 数据收集 | |
#10 | anthropic.com | 9.41M | Anthropic AI 研究公司 | |
#11 | openrouter.ai | 8.58M | OpenRouter 聊天机器人排名 | |
#12 | dataannotation.tech | 8.57M | Data Annotation AI 标记 | |
#13 | mistral.ai | 7.96M | Mistral AI 模型公司 | |
#14 | deepmind.google | 6.41M | Google DeepMind AI 研究 | |
#15 | minimax.io | 5.48M | MiniMax AI 平台 | |
#16 | snowflake.com | 4.75M | Snowflake AI 数据云 | |
#17 | databricks.com | 4.29M | Databricks AI 数据平台 | |
#18 | abacus.ai | 4.04M | Abacus.AI 企业 AI | |
#19 | crowdgen.com | 3.42M | CrowdGen AI 训练平台 | |
#20 | openreview.net | 2.96M | OpenReview AI 论文评审 | |
#21 | ai.google | 2.7M | Google AI 官网 | |
#22 | axon.ai | 2.47M | Axon AI 企业数据 | |
#23 | snowflakecomputing.com | 2.21M | Snowflake AI 数据计算 | |
#24 | artificialanalysis.ai | 2.2M | Artificial Analysis AI 基准 | |
#25 | telusinternational.ai | 2.18M | Telus International AI 数据标记 | |
#26 | glean.com | 2.01M | Glean AI 企业搜索 | |
#27 | bigmodel.cn | 1.68M | 智谱 AI 大模型平台 | |
#28 | wolfram.com | 1.6M | Wolfram AI 基准 | |
#29 | research.google | 1.56M | Google AI 研究 | |
#30 | domo.com | 1.33M | Domo AI 数据平台 | |
#31 | towardsdatascience.com | 1.28M | Towards Data Science AI 媒体 | |
#32 | amplitude.com | 1.22M | Amplitude AI 分析 | |
#33 | tiangong.cn | 1.22M | 天工 AI 模型平台 | |
#34 | iflytek.com | 1.16M | 科大讯飞 AI 语音技术 | |
#35 | toloka.ai | 1.11M | Toloka AI 数据标记 | |
#36 | minimaxi.com | 1.1M | MiniMax AI 备用站 | |
#37 | xfyun.cn | 1.02M | 讯飞开放平台 | |
#38 | analyticsvidhya.com | 1.01M | Analytics Vidhya AI 社区 | |
#39 | designarena.ai | 798.65K | Design Arena AI 基准 | |
#40 | stability.ai | 682.27K | Stability AI 官网 (Stable Diffusion 开发者) | |
#41 | zhipu.ai | 538K | 智谱 AI 官网 (ChatGLM 开发者) | |
#42 | moonshot.cn | 499.08K | 月之暗面官网 (Kimi 开发者) |
研究巨头
这份名单上的研究实验室是实际发明 AI 的组织,其他所有百万俱乐部工具都建立在此之上。它们的流量告诉你关于公众对 AI 本身的兴趣 — 不是作为一种使用的产品,而是作为一种需要理解的技术。
Google 通过彻底的碎片化占据主导地位:labs.google 有 3422 万(AI 实验和演示),deepmind.google 有 641 万(基础研究),ai.google 有 270 万(官方 AI 中心),research.google 有 156 万(已发表的研究)。合计:跨四个域名每月 4489 万次访问。这超过了 Anthropic、Mistral 和 xAI 的总和 — 反映了 Google 作为最大的 AI 研究组织和拥有最多面向公众的研究资产的公司的独特地位。
xAI 以 3283 万的访问量成为本次排名的惊喜。埃隆·马斯克(Elon Musk)的 AI 公司为其企业网站带来了巨大的流量 — 这得益于 Grok 的知名度以及围绕 xAI 融资、算力建设和模型发布的新闻周期。这是企业网站流量,而不是产品流量(Grok 的使用情况显示在聊天机器人排名中),但对于一个研究实验室来说,公司主页拥有 3300 万次访问是非凡的。
Anthropic (9.41M)
Claude 背后的安全聚焦实验室。Anthropic 的企业网站吸引了近 1000 万次访问 — 研究人员阅读论文、开发人员查看 API 文档,以及越来越多的公众关注其“宪法 AI”方法。Anthropic 的研究流量与 Claude 的产品流量之间的差距讲述了一家品牌与产品同样重要的公司的故事。
Mistral AI (7.96M)
欧洲领先的 AI 实验室。Mistral 通过可与封闭竞争对手相媲美的开放权重模型建立了信誉 — Mistral Large, Mixtral, 和紧凑的 Mistral 7B。其 800 万的访问量反映了开发者社区对美国和中国模型提供商之外的替代方案的浓厚兴趣。
DeepMind (6.41M)
Google 的基础研究部门。DeepMind 的流量由突破性出版物驱动 — 蛋白质结构的 AlphaFold、Gemini 模型开发以及强化学习的基础进展。这是在学术 AI 论文中被引用最多的实验室,其流量反映了这种影响力。
Stability AI (682.27K)
警示故事。Stability AI — Stable Diffusion(最具影响力的开源图像模型)的创造者 — 已经跌破百万俱乐部的门槛。领导层变动、资金挑战以及向封闭模型的转变已经造成了明显的损失。其低于 70 万的流量与使用其技术生成的数十亿张图像形成鲜明对比。
研究实验室流量是 AI 行业方向的领先指标。当实验室的企业网站流量激增时,意味着有重要内容发布或宣布。Anthropic 稳定的 940 万反映了持续的兴趣;xAI 的 3280 万反映了炒作驱动的关注。这种区别很重要:持续的流量与开发者的采用相关,而炒作驱动的流量通常会消退。
中国 AI 实验室
中国 AI 研究生态系统在此列表中有七个条目 — 它们的总流量讲述了一个西方报道一直低估的快速、平行发展的故事。
Qwen(通义千问)以 3276 万领先 — 阿里巴巴的开放权重模型家族已成为无数中国 AI 应用程序的基础。加上阿里云 (aliyun.com) 的 2905 万,阿里巴巴 AI 生态系统的总访问量超过 6100 万。Qwen 的流量反映了一些具体情况:它是中国开发者生态系统中用于微调的最流行的基础模型,就像西方的 Llama 一样。开发人员访问 qwen.ai 下载模型、文档和基准。
MiniMax (6.58M 合计)
多模态专家。MiniMax 构建用于文本、语音和视频生成的模型,在语音合成方面具有特别的优势。两个域名(minimax.io 548 万 + minimaxi.com 110 万)反映了其不断增长的开发者平台及其消费产品。
智谱 AI (2.22M 合计)
ChatGLM 开发者。智谱 AI 的双语模型为中国各地的企业 AI 应用程序提供支持。两个域名(bigmodel.cn 168 万用于模型平台 + zhipu.ai 53.8 万用于企业)服务于不同的受众 — 分别是开发人员和业务利益相关者。
科大讯飞 (2.18M 合计)
语音 AI 先驱。科大讯飞在中国语音识别和合成领域占据主导地位,其开放平台 (xfyun.cn 102 万) 服务于数十万开发人员。企业网站 (iflytek.com 116 万) 反映了其上市公司的形象。
天工与月之暗面
天工以 122 万代表昆仑万维的 AI 模型平台。月之暗面 (moonshot.cn 49.9 万) — Kimi(中国流行的长上下文聊天机器人)背后的公司 — 相对于 Kimi 的产品成功而言,其企业网站流量出奇地低,这反映了 Anthropic/Claude 的模式,即产品使实验室自己的网站相形见绌。
阿里巴巴因素
阿里巴巴在 Qwen 和 Aliyun 上的 AI 存在总计 6181 万月访问量 — 使其成为此排名中最大的单一实体,优势明显。这反映了 Google 如何分散在四个域名中但集中了更多流量。阿里巴巴同时是中国领先的开放权重模型提供商 (Qwen)、主导的云平台 (Aliyun),以及多家 AI 初创公司的投资者。它在中国 AI 中的地位比任何其他比较都更接近 Google 在西方的地位。
数据基础设施
此排名的数据基础设施层包含实际大规模部署、训练和提供 AI 模型的平台。这些是在 AI 淘金热中通过卖铲子赚钱的公司 — 它们的流量揭示了企业正在选择哪些平台。
SAP 的 AI 存在是此名单上最大的惊喜。ondemand.com 的 3887 万加上 cloud.sap 的 1427 万,使 SAP 的总访问量达到 5314 万 — 使其成为整个排名中流量最高的实体。SAP 并不以 AI 公司著称,但其业务技术平台将 AI 深度集成到数千家财富 500 强企业的企业工作流程中。流量来自访问 AI 驱动的应用程序的企业用户,而不是试验模型的开发人员。
Snowflake 的 475 万加上 snowflakecomputing.com 的 221 万,总计 696 万。Snowflake 的 AI 战略集中在 Cortex — 将机器学习直接带入企业数据已经所在的数据仓库。其宣传点是:不要将数据移动到 AI 平台;将 AI 带到数据中。Databricks 以 429 万直接竞争,提供统一的分析平台,在单一的湖仓架构中结合数据工程、数据科学和 AI 模型训练。
Abacus.AI (4.04M)
AI 打造的 AI 平台。Abacus.AI 让企业无需数据科学团队即可构建自定义 AI 代理并部署基础模型。其 400 万的访问量反映了对弥合模型能力与业务实施之间差距的无代码/低代码 AI 部署工具日益增长的需求。
Glean (2.01M)
企业 AI 搜索。Glean 索引公司的内部数据 — 文档、电子邮件、Slack 消息、代码 — 并使其可被 AI 搜索。在一个被企业数据淹没的世界里,Glean 解决了最基本的问题:找到你已经拥有的东西。
分析工具完善了基础设施层:Domo 以 133 万提供 AI 驱动的商业智能,Amplitude 以 122 万为产品分析添加 AI — 预测用户行为并识别人们如何与数字产品互动的模式。Axon 以 247 万通过 AI 集成处理企业数据管理。
AI 的基础设施之战不在于谁拥有最好的模型,而在于谁控制数据层。Snowflake、Databricks 和 SAP 押注企业将选择最接近其现有数据的平台。模型层正日益商品化;数据层才是锁定和利润所在。流量数字支持这一点:SAP 的 5300 万访问量使此名单上的每个纯粹的 AI 研究实验室相形见绌。
数据标记经济
地球上的每一个 AI 模型都是在人类标记的数据上训练出来的。ChatGPT 学习的文本、Midjourney 训练的图像、Copilot 内化的代码示例 — 所有这些都是由在此名单上的平台上工作的人员策划、注释、评级或纠正的。数据标记是使 AI 成为可能的隐形人类劳动。
Outlier 以 2100 万月访问量领跑该类别 — 其流量讲述了一个非凡的故事。对于一个大多数 AI 用户从未听说过的数据分析和注释平台来说,2100 万次访问是惊人的。这是来自成千上万工人的流量,他们每天登录以标记数据、对 AI 输出进行评级,并提供使 RLHF(人类反馈强化学习)发挥作用的人类反馈。当你听到 AI 模型被“对齐”或“微调”时,这种对齐来自在 Outlier 等平台上工作的人们。
Prolific 以 1332 万服务于不同的利基市场:学术和研究级数据收集。Outlier 专注于大规模 AI 训练数据,而 Prolific 将研究人员与人口统计多样化的参与者联系起来,进行研究、调查和行为实验。它是为许多学术 AI 安全和对齐研究提供动力的平台 — 其 1300 万次访问反映了 AI 研究的规模和对高质量人类数据日益增长的需求。
Data Annotation (8.57M)
AI 训练劳动力。DataAnnotation.tech 将人类注释者与需要训练数据的 AI 公司联系起来 — 文本标记、图像分类、偏好排名以及区分好模型与优秀模型的细粒度质量评估。
CrowdGen (3.42M)
众包 AI 训练。CrowdGen 组织大规模数据标记项目,在托管的劳动力中分配注释任务。流量反映了该平台在主要模型开发人员的 AI 训练管道中的作用。
Telus International (2.18M)
来自加拿大主要科技公司的企业级数据标记。Telus International 提供大规模 AI 训练数据服务,并具有企业客户所需的质量保证流程 — 这是一个比市场平台更结构化的选择。
Toloka (1.11M)
开放数据标记平台。Toloka — 最初是一个 Yandex 项目 — 提供众包注释工具,特别关注多语言和跨文化数据收集。其开放方式使其在学术环境中很受欢迎。
隐形劳动力
此名单上的数据标记平台 — Outlier, Prolific, Data Annotation, CrowdGen, Telus International, 和 Toloka — 总共吸引了超过 4900 万月访问量。这比 Anthropic, Mistral, 和 DeepMind 的总和还要多。这些平台在全球雇佣了数百万工人,他们从事着训练 AI 的艰苦工作:对响应进行评级、标记错误、标记图像,并提供任何算法都无法替代的人类判断。AI 行业最重要的劳动力也是最不明显的。
基准与排行榜
你怎么知道哪个 AI 模型最好?你查阅基准。此名单上的基准和排行榜平台已成为 AI 质量的仲裁者 — 它们的流量揭示了 AI 社区对比较评估的依赖程度。
LMSys Arena 以 2533 万成为世界上最有影响力的 AI 评估平台。其“Chatbot Arena”使用盲测头对头比较 — 用户与两个匿名模型聊天并选择更好的回答 — 以生成整个行业视为基本事实的 Elo 评级。当一个新模型声称是“最先进的”时,第一个问题总是:它的 Arena 分数是多少?2500 万次访问意味着每月有数十万人积极参与模型评估。
OpenRouter 以 858 万扮演双重角色:它既是一个模型路由平台(让开发人员通过单个 API 访问多个 AI 模型),也是一个社区驱动的排名系统,其中使用模式揭示了开发人员实际偏好哪些模型。流量反映了实用性和比较兴趣 — 开发人员来使用模型并留下来比较它们。
OpenReview (2.96M)
学术守门人。OpenReview 主办顶级 AI 会议(NeurIPS, ICLR 等)的同行评审过程。其 300 万次访问来自提交论文、阅读评论和跟踪哪些想法被接受的研究人员。如果说 LMSys 评价模型,那么 OpenReview 评价想法。
Artificial Analysis (2.2M)
性能追踪器。Artificial Analysis 在速度、成本和质量方面对 AI 模型进行基准测试 — 这是企业在提供商之间进行选择时关心的三个维度。其独立测试方法使其成为值得信赖的中立模型比较来源。
Wolfram (1.6M)
计算权威。Wolfram 的知识引擎提供 AI 基准基础设施和计算工具,作为数学和科学 AI 评估的基本事实。Stephen Wolfram 对理解 AI 能力的框架增加了一个独特的分析视角。
Design Arena (798.65K)
Chatbot Arena 的视觉对应物。Design Arena 将相同的头对头评估模型应用于 AI 生成的设计和视觉输出。虽然仍低于百万俱乐部阈值,但随着 AI 社区寻求评估视觉 AI 质量的标准化方法,其增长迅速。
AI 媒体和社区平台也对研究讨论做出了贡献:Towards Data Science 以 128 万提供关于 AI 和数据科学的通俗易懂的技术写作,而 Analytics Vidhya 以 101 万通过教程、竞赛和职业资源服务于更广泛的数据科学学习社区。
LMSys Arena 的 2500 万次访问代表了技术评估方式的根本转变。在以前的科技时代,专业评论家和行业出版物决定哪些产品最好。在 AI 领域,社区自己决定 — 通过盲测评估、公开基准和众包偏好。基准平台变得比任何个人评论家都更有影响力,其评级能影响市场、融资决策和工程优先级。
方法论与数据来源
所有流量数字均来自 SimilarWeb,反映了 2025 年 12 月的估算值。
此排名包括 42 个平台 — 对于百万俱乐部系列来说属于中等规模。该类别本质上比“聊天机器人”或“图像生成器”更难定义,因为研究和数据科学涵盖了广泛的功能。我包括了主要关于创建、训练、评估或理解 AI 的平台 — 而不是关于使用 AI 作为成品(那些出现在其他排名中)的平台。
四个条目低于 100 万访问量:Design Arena (79.865万), Stability AI (68.227万), 智谱 AI (53.8万), 和月之暗面 (49.908万)。我将它们包括在内,是因为它们对 AI 生态系统的影响远远超过其流量所显示的。Stability AI 创建了 Stable Diffusion。智谱 AI 构建了 ChatGLM。月之暗面开发了 Kimi。Design Arena 正在开创视觉 AI 评估。流量和影响力并不总是相关的 — 尤其是对于研究实验室而言。
多域名实体经常出现:Google 跨越四个域名(合计约 4500 万),SAP 跨越两个(约 5300 万),阿里巴巴跨越两个(约 6200 万),Snowflake 跨越两个(约 700 万),MiniMax 跨越两个(约 660 万),科大讯飞跨越两个(约 220 万),智谱 AI 跨越两个(约 220 万)。每个域名单独列出,因为 SimilarWeb 独立跟踪它们。
免费层级比例为 42 个中的 29 个(69%) — 高于商业与营销类别,但低于消费者 AI 工具。许多研究资源本质上是免费的(论文、基准、实验),而企业数据基础设施通常需要付费访问。
更新时间表
我计划在每月 22 日左右更新此排名。研究实验室的流量往往在重大公告和会议季节(12 月的 NeurIPS,春季的 ICLR)期间激增。基准流量 — 尤其是 LMSys Arena — 与新模型发布直接相关。数据标记平台显示出最稳定的增长,反映了对人类注释训练数据的永不满足的需求。
“你使用的每一个 AI 模型都是由研究实验室构建,在人类标记的数据上训练,在基准上评估,并部署在云基础设施上的。此名单上的 42 个平台就是那个可见的供应链。它们没有登上头条新闻 — 聊天机器人和图像生成器登上了 — 但它们是这些产品存在的原因。下次当 AI 给你一个出奇好的答案时,请记住:Outlier 的某个人可能在六个月前对类似的答案评级为‘首选’,DeepMind 的研究人员发表了使之成为可能的技术,而 LMSys Arena 告诉世界它是好的。”
讨论
0 条评论留下评论
成为第一个分享您想法的人!