構建 AI 的公司和評估 AI 的公司,現在產生的流量與 AI 產品本身一樣大。
百萬俱樂部 — 研究與資料科學版。這是排名背後的排名。出現在其他百萬俱樂部文章中的每一個 AI 聊天機器人、圖像生成器和編碼工具,都是由研究實驗室構建,在標註資料上訓練,並在出現在此列表中的基準上進行評估的。這就是智慧本身的供應鏈。
這裡的驚喜是結構性的。SAP — 是的,那家企業軟體公司 — 以其 AI 平台近 3900 萬的月造訪量領先。Google 分散在四個研究領域,總計 4500 萬。大多數人從未聽說過的資料標註公司 — Outlier, Prolific, Data Annotation — 總共吸引了超過 4000 萬次造訪。而 LMSys Arena 以 2500 萬的造訪量已成為比較 AI 模型的事實標準,其產生的流量比它評估的大多數模型都要多。
我追蹤了跨越 AI 研究實驗室、資料基礎設施、標註服務、基準測試和研究社群的 42 個平台。其中 29 個提供免費使用。有四個條目的造訪量低於 100 萬,但因其對 AI 生態系統的巨大影響力而被收錄。所有數字均來自 SimilarWeb,反映了 2025 年 12 月的估算值。我計劃在每月 22 日左右更新這些資料。
完整排名
這是按月流量排名的所有 42 個 AI 研究和資料科學平台。這是該系列中最異構的排名 — 研究實驗室緊挨著資料標註市場,雲端平台緊挨著學術論文審查網站。將它們聯繫在一起的是它們在 AI 供應鏈中的角色:構建模型、訓練模型、評估模型,或提供部署模型的基礎設施。42 個平台中有 29 個提供免費使用。
| # | 網域 | 月造訪量 | 服務 | 免費 |
|---|---|---|---|---|
🥇 | ondemand.com | 38.87M | SAP BTP AI 平台 | |
🥈 | labs.google | 34.22M | Google AI 實驗 | |
🥉 | x.ai | 32.83M | xAI 公司官網 | |
#4 | qwen.ai | 32.76M | 阿里通義千問官網 | |
#5 | aliyun.com | 29.05M | 阿里雲 AI 服務 | |
#6 | lmarena.ai | 25.33M | LMSys Arena AI 模型評估 | |
#7 | outlier.ai | 21M | Outlier AI 資料分析 | |
#8 | cloud.sap | 14.27M | SAP AI 平台 | |
#9 | prolific.com | 13.32M | Prolific AI 資料收集 | |
#10 | anthropic.com | 9.41M | Anthropic AI 研究公司 | |
#11 | openrouter.ai | 8.58M | OpenRouter 聊天機器人排名 | |
#12 | dataannotation.tech | 8.57M | Data Annotation AI 標註 | |
#13 | mistral.ai | 7.96M | Mistral AI 模型公司 | |
#14 | deepmind.google | 6.41M | Google DeepMind AI 研究 | |
#15 | minimax.io | 5.48M | MiniMax AI 平台 | |
#16 | snowflake.com | 4.75M | Snowflake AI 資料雲 | |
#17 | databricks.com | 4.29M | Databricks AI 資料平台 | |
#18 | abacus.ai | 4.04M | Abacus.AI 企業 AI | |
#19 | crowdgen.com | 3.42M | CrowdGen AI 訓練平台 | |
#20 | openreview.net | 2.96M | OpenReview AI 論文評審 | |
#21 | ai.google | 2.7M | Google AI 官網 | |
#22 | axon.ai | 2.47M | Axon AI 企業資料 | |
#23 | snowflakecomputing.com | 2.21M | Snowflake AI 資料運算 | |
#24 | artificialanalysis.ai | 2.2M | Artificial Analysis AI 基準 | |
#25 | telusinternational.ai | 2.18M | Telus International AI 資料標註 | |
#26 | glean.com | 2.01M | Glean AI 企業搜尋 | |
#27 | bigmodel.cn | 1.68M | 智譜 AI 大模型平台 | |
#28 | wolfram.com | 1.6M | Wolfram AI 基準 | |
#29 | research.google | 1.56M | Google AI 研究 | |
#30 | domo.com | 1.33M | Domo AI 資料平台 | |
#31 | towardsdatascience.com | 1.28M | Towards Data Science AI 媒體 | |
#32 | amplitude.com | 1.22M | Amplitude AI 分析 | |
#33 | tiangong.cn | 1.22M | 天工 AI 模型平台 | |
#34 | iflytek.com | 1.16M | 科大訊飛 AI 語音技術 | |
#35 | toloka.ai | 1.11M | Toloka AI 資料標註 | |
#36 | minimaxi.com | 1.1M | MiniMax AI 備用站 | |
#37 | xfyun.cn | 1.02M | 訊飛開放平台 | |
#38 | analyticsvidhya.com | 1.01M | Analytics Vidhya AI 社群 | |
#39 | designarena.ai | 798.65K | Design Arena AI 基準 | |
#40 | stability.ai | 682.27K | Stability AI 官網 (Stable Diffusion 開發者) | |
#41 | zhipu.ai | 538K | 智譜 AI 官網 (ChatGLM 開發者) | |
#42 | moonshot.cn | 499.08K | 月之暗面官網 (Kimi 開發者) |
研究巨擘
這份名單上的研究實驗室是實際發明 AI 的組織,其他所有百萬俱樂部工具都建立在此之上。它們的流量告訴你關於公眾對 AI 本身的興趣 — 不是作為一種使用的產品,而是作為一種需要理解的技術。
Google 通過徹底的碎片化佔據主導地位:labs.google 有 3422 萬(AI 實驗和演示),deepmind.google 有 641 萬(基礎研究),ai.google 有 270 萬(官方 AI 中心),research.google 有 156 萬(已發表的研究)。合計:跨四個網域每月 4489 萬次造訪。這超過了 Anthropic、Mistral 和 xAI 的總和 — 反映了 Google 作為最大的 AI 研究組織和擁有最多面向公眾的研究資產的公司的獨特地位。
xAI 以 3283 萬的造訪量成為本次排名的驚喜。伊隆·馬斯克(Elon Musk)的 AI 公司為其企業網站帶來了巨大的流量 — 這得益於 Grok 的知名度以及圍繞 xAI 融資、算力建設和模型發佈的新聞週期。這是企業網站流量,而不是產品流量(Grok 的使用情況顯示在聊天機器人排名中),但對於一個研究實驗室來說,公司首頁擁有 3300 萬次造訪是非凡的。
Anthropic (9.41M)
Claude 背後的安全聚焦實驗室。Anthropic 的企業網站吸引了近 1000 萬次造訪 — 研究人員閱讀論文、開發人員查看 API 文件,以及越來越多的公眾關注其「憲法 AI」方法。Anthropic 的研究流量與 Claude 的產品流量之間的差距講述了一家品牌與產品同樣重要的公司的故事。
Mistral AI (7.96M)
歐洲領先的 AI 實驗室。Mistral 通過可與封閉競爭對手相媲美的開放權重模型建立了信譽 — Mistral Large, Mixtral, 和緊湊的 Mistral 7B。其 800 萬的造訪量反映了開發者社群對美國和中國模型提供商之外的替代方案的濃厚興趣。
DeepMind (6.41M)
Google 的基礎研究部門。DeepMind 的流量由突破性出版物驅動 — 蛋白質結構的 AlphaFold、Gemini 模型開發以及強化學習的基礎進展。這是在學術 AI 論文中被引用最多的實驗室,其流量反映了這種影響力。
Stability AI (682.27K)
警示故事。Stability AI — Stable Diffusion(最具影響力的開源圖像模型)的創造者 — 已經跌破百萬俱樂部的門檻。領導層變動、資金挑戰以及向封閉模型的轉變已經造成了明顯的損失。其低於 70 萬的流量與使用其技術生成的數十億張圖像形成鮮明對比。
研究實驗室流量是 AI 行業方向的領先指標。當實驗室的企業網站流量激增時,意味著有重要內容發佈或宣佈。Anthropic 穩定的 940 萬反映了持續的興趣;xAI 的 3280 萬反映了炒作驅動的關注。這種區別很重要:持續的流量與開發者的採用相關,而炒作驅動的流量通常會消退。
中國 AI 實驗室
中國 AI 研究生態系統在此列表中有七個條目 — 它們的總流量講述了一個西方報導一直低估的快速、平行發展的故事。
Qwen(通義千問)以 3276 萬領先 — 阿里巴巴的開放權重模型家族已成為無數中國 AI 應用程式的基礎。加上阿里雲 (aliyun.com) 的 2905 萬,阿里巴巴 AI 生態系統的總造訪量超過 6100 萬。Qwen 的流量反映了一些具體情況:它是中國開發者生態系統中用於微調的最流行的基礎模型,就像西方的 Llama 一樣。開發人員造訪 qwen.ai 下載模型、文件和基準。
MiniMax (6.58M 合計)
多模態專家。MiniMax 構建用於文本、語音和影片生成的模型,在語音合成方面具有特別的優勢。兩個網域(minimax.io 548 萬 + minimaxi.com 110 萬)反映了其不斷增長的開發者平台及其消費產品。
智譜 AI (2.22M 合計)
ChatGLM 開發者。智譜 AI 的雙語模型為中國各地的企業 AI 應用程式提供支援。兩個網域(bigmodel.cn 168 萬用於模型平台 + zhipu.ai 53.8 萬用於企業)服務於不同的受眾 — 分別是開發人員和業務利益相關者。
科大訊飛 (2.18M 合計)
語音 AI 先驅。科大訊飛在中國語音識別和合成領域佔據主導地位,其開放平台 (xfyun.cn 102 萬) 服務於數十萬開發人員。企業網站 (iflytek.com 116 萬) 反映了其上市公司的形象。
天工與月之暗面
天工以 122 萬代表崑崙萬維的 AI 模型平台。月之暗面 (moonshot.cn 49.9 萬) — Kimi(中國流行的長上下文聊天機器人)背後的公司 — 相對於 Kimi 的產品成功而言,其企業網站流量出奇地低,這反映了 Anthropic/Claude 的模式,即產品使實驗室自己的網站相形見絀。
阿里巴巴因素
阿里巴巴在 Qwen 和 Aliyun 上的 AI 存在總計 6181 萬月造訪量 — 使其成為此排名中最大的單一實體,優勢明顯。這反映了 Google 如何分散在四個網域中但集中了更多流量。阿里巴巴同時是中國領先的開放權重模型提供商 (Qwen)、主導的雲端平台 (Aliyun),以及多家 AI 初創公司的投資者。它在中國 AI 中的地位比任何其他比較都更接近 Google 在西方的地位。
資料基礎設施
此排名的資料基礎設施層包含實際大規模部署、訓練和提供 AI 模型的平台。這些是在 AI 淘金熱中通過賣鏟子賺錢的公司 — 它們的流量揭示了企業正在選擇哪些平台。
SAP 的 AI 存在是此名單上最大的驚喜。ondemand.com 的 3887 萬加上 cloud.sap 的 1427 萬,使 SAP 的總造訪量達到 5314 萬 — 使其成為整個排名中流量最高的實體。SAP 並不以 AI 公司著稱,但其業務技術平台將 AI 深度整合到數千家財富 500 強企業的企業工作流程中。流量來自造訪 AI 驅動的應用程式的企業使用者,而不是試驗模型的開發人員。
Snowflake 的 475 萬加上 snowflakecomputing.com 的 221 萬,總計 696 萬。Snowflake 的 AI 戰略集中在 Cortex — 將機器學習直接帶入企業資料已經所在的資料倉儲。其宣傳點是:不要將資料移動到 AI 平台;將 AI 帶到資料中。Databricks 以 429 萬直接競爭,提供統一的分析平台,在單一的湖倉架構中結合資料工程、資料科學和 AI 模型訓練。
Abacus.AI (4.04M)
AI 打造的 AI 平台。Abacus.AI 讓企業無需資料科學團隊即可構建自定義 AI 代理並部署基礎模型。其 400 萬的造訪量反映了對彌合模型能力與業務實施之間差距的無程式碼/低程式碼 AI 部署工具日益增長的需求。
Glean (2.01M)
企業 AI 搜尋。Glean 索引公司的內部資料 — 文件、電子郵件、Slack 訊息、程式碼 — 並使其可被 AI 搜尋。在一個被企業資料淹沒的世界裡,Glean 解決了最基本的問題:找到你已經擁有的東西。
分析工具完善了基礎設施層:Domo 以 133 萬提供 AI 驅動的商業智慧,Amplitude 以 122 萬為產品分析添加 AI — 預測使用者行為並識別人們如何與數位產品互動的模式。Axon 以 247 萬通過 AI 整合處理企業資料管理。
AI 的基礎設施之戰不在於誰擁有最好的模型,而在于誰控制資料層。Snowflake、Databricks 和 SAP 押注企業將選擇最接近其現有資料的平台。模型層正日益商品化;資料層才是鎖定和利潤所在。流量數字支持這一點:SAP 的 5300 萬造訪量使此名單上的每個純粹的 AI 研究實驗室相形見絀。
資料標註經濟
地球上的每一個 AI 模型都是在人類標註的資料上訓練出來的。ChatGPT 學習的文本、Midjourney 訓練的圖像、Copilot 內化的程式碼範例 — 所有這些都是由在此名單上的平台上工作的人員策劃、註釋、評級或糾正的。資料標註是使 AI 成為可能的隱形人類勞動。
Outlier 以 2100 萬月造訪量領跑該類別 — 其流量講述了一個非凡的故事。對於一個大多數 AI 使用者從未聽說過的資料分析和註釋平台來說,2100 萬次造訪是驚人的。這是來自成千上萬工人的流量,他們每天登入以標註資料、對 AI 輸出進行評級,並提供使 RLHF(人類回饋強化學習)發揮作用的人類回饋。當你聽到 AI 模型被「對齊」或「微調」時,這種對齊來自在 Outlier 等平台上工作的人們。
Prolific 以 1332 萬服務於不同的利基市場:學術和研究級資料收集。Outlier 專注於大規模 AI 訓練資料,而 Prolific 將研究人員與人口統計多樣化的參與者聯繫起來,進行研究、調查和行為實驗。它是為許多學術 AI 安全和對齊研究提供動力的平台 — 其 1300 萬次造訪反映了 AI 研究的規模和對高品質人類資料日益增長的需求。
Data Annotation (8.57M)
AI 訓練勞動力。DataAnnotation.tech 將人類註釋者與需要訓練資料的 AI 公司聯繫起來 — 文本標註、圖像分類、偏好排名以及區分好模型與優秀模型的細粒度品質評估。
CrowdGen (3.42M)
群眾外包 AI 訓練。CrowdGen 組織大規模資料標註專案,在託管的勞動力中分配註釋任務。流量反映了該平台在主要模型開發人員的 AI 訓練管道中的作用。
Telus International (2.18M)
來自加拿大主要科技公司的企業級資料標註。Telus International 提供大規模 AI 訓練資料服務,並具有企業客戶所需的品質保證流程 — 這是一個比市場平台更結構化的選擇。
Toloka (1.11M)
開放資料標註平台。Toloka — 最初是一個 Yandex 專案 — 提供群眾外包註釋工具,特別關注多語言和跨文化資料收集。其開放方式使其在學術環境中很受歡迎。
隱形勞動力
此名單上的資料標註平台 — Outlier, Prolific, Data Annotation, CrowdGen, Telus International, 和 Toloka — 總共吸引了超過 4900 萬月造訪量。這比 Anthropic, Mistral, 和 DeepMind 的總和還要多。這些平台在全球僱用了數百萬工人,他們從事著訓練 AI 的艱苦工作:對回應進行評級、標註錯誤、標註圖像,並提供任何演算法都無法替代的人類判斷。AI 行業最重要的勞動力也是最不明顯的。
基準與排行榜
你怎麼知道哪個 AI 模型最好?你查閱基準。此名單上的基準和排行榜平台已成為 AI 品質的仲裁者 — 它們的流量揭示了 AI 社群對比較評估的依賴程度。
LMSys Arena 以 2533 萬成為世界上最有影響力的 AI 評估平台。其「Chatbot Arena」使用盲測頭對頭比較 — 使用者與兩個匿名模型聊天並選擇更好的回答 — 以生成整個行業視為基本事實的 Elo 評級。當一個新模型聲稱是「最先進的」時,第一個問題總是:它的 Arena 分數是多少?2500 萬次造訪意味著每月有數十萬人積極參與模型評估。
OpenRouter 以 858 萬扮演雙重角色:它既是一個模型路由平台(讓開發人員通過單個 API 存取多個 AI 模型),也是一個社群驅動的排名系統,其中使用模式揭示了開發人員實際偏好哪些模型。流量反映了實用性和比較興趣 — 開發人員來使用模型並留下來比較它們。
OpenReview (2.96M)
學術守門人。OpenReview 主辦頂級 AI 會議(NeurIPS, ICLR 等)的同行評審過程。其 300 萬次造訪來自提交論文、閱讀評論和追蹤哪些想法被接受的研究人員。如果說 LMSys 評價模型,那麼 OpenReview 評價想法。
Artificial Analysis (2.2M)
性能追蹤器。Artificial Analysis 在速度、成本和品質方面對 AI 模型進行基準測試 — 這是企業在提供商之間進行選擇時關心的三個維度。其獨立測試方法使其成為值得信賴的中立模型比較來源。
Wolfram (1.6M)
計算權威。Wolfram 的知識引擎提供 AI 基準基礎設施和計算工具,作為數學和科學 AI 評估的基本事實。Stephen Wolfram 對理解 AI 能力的框架增加了一個獨特的分析視角。
Design Arena (798.65K)
Chatbot Arena 的視覺對應物。Design Arena 將相同的頭對頭評估模型應用於 AI 生成的設計和視覺輸出。雖然仍低於百萬俱樂部閾值,但隨著 AI 社群尋求評估視覺 AI 品質的標準化方法,其增長迅速。
AI 媒體和社群平台也對研究討論做出了貢獻:Towards Data Science 以 128 萬提供關於 AI 和資料科學的通俗易懂的技術寫作,而 Analytics Vidhya 以 101 萬通過教程、競賽和職業資源服務於更廣泛的資料科學學習社群。
LMSys Arena 的 2500 萬次造訪代表了技術評估方式的根本轉變。在以前的科技時代,專業評論家和行業出版物決定哪些產品最好。在 AI 領域,社群自己決定 — 通過盲測評估、公開基準和群眾外包偏好。基準平台變得比任何個人評論家都更有影響力,其評級能影響市場、融資決策和工程優先順序。
方法論與資料來源
所有流量數字均來自 SimilarWeb,反映了 2025 年 12 月的估算值。
此排名包括 42 個平台 — 對於百萬俱樂部系列來說屬於中等規模。該類別本質上比「聊天機器人」或「圖像生成器」更難定義,因為研究和資料科學涵蓋了廣泛的功能。我包括了主要關於創建、訓練、評估或理解 AI 的平台 — 而不是關於使用 AI 作為成品(那些出現在其他排名中)的平台。
四個條目低於 100 萬造訪量:Design Arena (79.865萬), Stability AI (68.227萬), 智譜 AI (53.8萬), 和月之暗面 (49.908萬)。我將它們包括在內,是因為它們對 AI 生態系統的影響遠遠超過其流量所顯示的。Stability AI 創建了 Stable Diffusion。智譜 AI 構建了 ChatGLM。月之暗面開發了 Kimi。Design Arena 正在開創視覺 AI 評估。流量和影響力並不總是相關的 — 尤其是對於研究實驗室而言。
多網域實體經常出現:Google 跨越四個網域(合計約 4500 萬),SAP 跨越兩個(約 5300 萬),阿里巴巴跨越兩個(約 6200 萬),Snowflake 跨越兩個(約 700 萬),MiniMax 跨越兩個(約 660 萬),科大訊飛跨越兩個(約 220 萬),智譜 AI 跨越兩個(約 220 萬)。每個網域單獨列出,因為 SimilarWeb 獨立追蹤它們。
免費層級比例為 42 個中的 29 個(69%) — 高於商業與行銷類別,但低於消費者 AI 工具。許多研究資源本質上是免費的(論文、基準、實驗),而企業資料基礎設施通常需要付費使用。
更新時間表
我計劃在每月 22 日左右更新此排名。研究實驗室的流量往往在重大公告和會議季節(12 月的 NeurIPS,春季的 ICLR)期間激增。基準流量 — 尤其是 LMSys Arena — 與新模型發佈直接相關。資料標註平台顯示出最穩定的增長,反映了對人類註釋訓練資料的永不滿足的需求。
「你使用的每一個 AI 模型都是由研究實驗室構建,在人類標註的資料上訓練,在基準上評估,並部署在雲端基礎設施上的。此名單上的 42 個平台就是那個可見的供應鏈。它們沒有登上頭條新聞 — 聊天機器人和圖像生成器登上了 — 但它們是這些產品存在的原因。下次當 AI 給你一個出奇好的答案時,請記住:Outlier 的某個人可能在六個月前對類似的答案評級為『首選』,DeepMind 的研究人員發表了使之成為可能的技術,而 LMSys Arena 告訴世界它是好的。」
討論
0 條評論留下評論
成為第一個分享您想法的人!