O Clube do Milhão — Todas as Plataformas de Pesquisa em IA e Ciência de Dados Classificadas por Tráfego Real

A Regra

As empresas que constroem IA e as empresas que avaliam IA estão agora gerando tanto tráfego quanto os próprios produtos de IA.

O Clube do Milhão — Edição de Pesquisa e Ciência de Dados. Esta é a classificação por trás das classificações. Todo chatbot de IA, gerador de imagens e ferramenta de codificação que aparece nos outros artigos do Clube do Milhão foi construído por um laboratório de pesquisa, treinado em dados rotulados e avaliado em um benchmark que aparece nesta lista. Esta é a cadeia de suprimentos da própria inteligência.

As surpresas aqui são estruturais. A SAP — sim, a empresa de software empresarial — lidera com quase 39 milhões de visitas mensais à sua plataforma de IA. O Google fragmenta-se em quatro domínios de pesquisa totalizando 45 milhões. As empresas de rotulagem de dados de que a maioria das pessoas nunca ouviu falar — Outlier, Prolific, Data Annotation — coletivamente atraem mais de 40 milhões de visitas. E a LMSys Arena, com 25 milhões, tornou-se o padrão de fato para comparar modelos de IA, gerando mais tráfego do que a maioria dos modelos que avalia.

Rastreei 42 plataformas entre laboratórios de pesquisa em IA, infraestrutura de dados, serviços de rotulagem, benchmarks e comunidades de pesquisa. 29 oferecem acesso gratuito. Quatro entradas estão abaixo de 1 milhão de visitas, mas foram incluídas por sua influência desproporcional no ecossistema de IA. Todos os números são da SimilarWeb, refletindo estimativas de dezembro de 2025. Pretendo atualizá-los por volta do dia 22 de cada mês.

As Classificações Completas

Aqui estão todas as 42 plataformas de pesquisa em IA e ciência de dados classificadas por tráfego mensal. Esta é a classificação mais heterogênea da série — laboratórios de pesquisa ficam ao lado de mercados de rotulagem de dados, plataformas de nuvem ao lado de sites de revisão de artigos acadêmicos. O que os une é seu papel na cadeia de suprimentos de IA: construir modelos, treiná-los, avaliá-los ou fornecer a infraestrutura para implantá-los. 29 de 42 oferecem acesso gratuito.

# Domínio Visitas Mensais Serviço Grátis
🥇
ondemand.com38.87MPlataforma SAP BTP AI
🥈
labs.google34.22MExperimentos Google AI
🥉
x.ai32.83MSite oficial da empresa xAI
#4
qwen.ai32.76MSite oficial Alibaba Qwen AI
#5
aliyun.com29.05MServiços Alibaba Cloud AI
#6
lmarena.ai25.33MAvaliação de modelos LMSys Arena
#7
outlier.ai21MAnálise de dados Outlier AI
#8
cloud.sap14.27MPlataforma SAP AI
#9
prolific.com13.32MColeta de dados Prolific AI
#10
anthropic.com9.41MEmpresa de pesquisa Anthropic AI
#11
openrouter.ai8.58MClassificação de chatbots OpenRouter
#12
dataannotation.tech8.57MRotulagem Data Annotation AI
#13
mistral.ai7.96MEmpresa de modelos Mistral AI
#14
deepmind.google6.41MPesquisa Google DeepMind AI
#15
minimax.io5.48MPlataforma MiniMax AI
#16
snowflake.com4.75MNuvem de dados Snowflake AI
#17
databricks.com4.29MPlataforma de dados Databricks AI
#18
abacus.ai4.04MIA empresarial Abacus.AI
#19
crowdgen.com3.42MPlataforma de treinamento CrowdGen AI
#20
openreview.net2.96MRevisão de artigos OpenReview AI
#21
ai.google2.7MSite oficial Google AI
#22
axon.ai2.47MDados empresariais Axon AI
#23
snowflakecomputing.com2.21MComputação de dados Snowflake AI
#24
artificialanalysis.ai2.2MBenchmark Artificial Analysis AI
#25
telusinternational.ai2.18MRotulagem de dados Telus International
#26
glean.com2.01MBusca empresarial Glean AI
#27
bigmodel.cn1.68MPlataforma de grandes modelos Zhipu AI
#28
wolfram.com1.6MBenchmark Wolfram AI
#29
research.google1.56MPesquisa Google AI
#30
domo.com1.33MPlataforma de dados Domo AI
#31
towardsdatascience.com1.28MMídia de IA Towards Data Science
#32
amplitude.com1.22MAnálise Amplitude AI
#33
tiangong.cn1.22MPlataforma de modelos Tiangong AI
#34
iflytek.com1.16MTecnologia de voz iFlytek AI
#35
toloka.ai1.11MRotulagem de dados Toloka AI
#36
minimaxi.com1.1MMiniMax AI alternativo
#37
xfyun.cn1.02MPlataforma aberta iFlytek
#38
analyticsvidhya.com1.01MComunidade Analytics Vidhya AI
#39
designarena.ai798.65KBenchmark Design Arena AI
#40
stability.ai682.27KSite oficial Stability AI (Stable Diffusion)
#41
zhipu.ai538KSite oficial Zhipu AI (ChatGLM)
#42
moonshot.cn499.08KSite oficial Moonshot AI (Kimi)

Os Titãs da Pesquisa

Os laboratórios de pesquisa nesta lista são as organizações que realmente inventam a IA sobre a qual todas as outras ferramentas do Clube do Milhão são construídas. O tráfego deles diz algo sobre o interesse público na própria IA — não como um produto para usar, mas como uma tecnologia para entender.

O Google domina através da pura fragmentação: labs.google com 34,22 milhões (experimentos de IA e demonstrações), deepmind.google com 6,41 milhões (pesquisa fundamental), ai.google com 2,7 milhões (o hub oficial de IA) e research.google com 1,56 milhões (pesquisa publicada). Combinado: 44,89 milhões de visitas mensais em quatro domínios. Isso é mais do que Anthropic, Mistral e xAI combinados — refletindo a posição única do Google como a maior organização de pesquisa em IA e a empresa com mais propriedades de pesquisa voltadas para o público.

A xAI, com 32,83 milhões, é a surpresa desta classificação. A empresa de IA de Elon Musk gerou um tráfego enorme para seu site corporativo — impulsionado pela visibilidade do Grok e pelo ciclo constante de notícias em torno do financiamento da xAI, construção de computação e lançamentos de modelos. Este é o tráfego do site corporativo, não tráfego de produto (o uso do Grok aparece na classificação de chatbots), mas 33 milhões de visitas a uma página inicial de empresa é extraordinário para um laboratório de pesquisa.

Anthropic (9.41M)

O laboratório focado em segurança por trás do Claude. O site corporativo da Anthropic atrai quase 10 milhões de visitas — pesquisadores lendo artigos, desenvolvedores verificando documentos da API e um público crescente seguindo sua abordagem de IA Constitucional. A lacuna entre o tráfego de pesquisa da Anthropic e o tráfego de produto do Claude conta a história de uma empresa cuja marca importa tanto quanto seu produto.

Mistral AI (7.96M)

O principal laboratório de IA da Europa. A Mistral construiu credibilidade através de modelos de peso aberto que rivalizam com concorrentes fechados — Mistral Large, Mixtral e o compacto Mistral 7B. Seus 8 milhões de visitas refletem o intenso interesse da comunidade de desenvolvedores em alternativas aos provedores de modelos dos EUA e da China.

DeepMind (6.41M)

O braço de pesquisa fundamental do Google. O tráfego da DeepMind é impulsionado por publicações inovadoras — AlphaFold para estrutura de proteínas, desenvolvimento do modelo Gemini e avanços fundamentais em aprendizado por reforço. Este é o laboratório mais citado em artigos acadêmicos de IA, e seu tráfego reflete essa influência.

Stability AI (682.27K)

O conto de advertência. A Stability AI — criadora do Stable Diffusion, o modelo de imagem de código aberto mais influente — caiu abaixo do limite do Clube do Milhão. Mudanças de liderança, desafios de financiamento e a mudança para modelos fechados cobraram um preço visível. Seu tráfego abaixo de 700 mil contrasta fortemente com os bilhões de imagens geradas usando sua tecnologia.

💡

O tráfego de laboratórios de pesquisa é um indicador antecedente da direção da indústria de IA. Quando o site corporativo de um laboratório tem um pico, significa que algo significativo foi publicado ou anunciado. Os 9,4 milhões constantes da Anthropic refletem interesse sustentado; os 32,8 milhões da xAI refletem atenção impulsionada pelo hype. A distinção importa: tráfego sustentado correlaciona-se com a adoção por desenvolvedores, enquanto tráfego impulsionado por hype geralmente desaparece.

Os Laboratórios de IA Chineses

O ecossistema de pesquisa em IA chinês é representado por sete entradas nesta lista — e seu tráfego combinado conta uma história de desenvolvimento rápido e paralelo que a cobertura ocidental consistentemente subestima.

Qwen com 32,76 milhões lidera — a família de modelos de peso aberto do Alibaba que se tornou a base para inúmeras aplicações de IA chinesas. Combinado com o Alibaba Cloud (aliyun.com) com 29,05 milhões, o ecossistema de IA do Alibaba totaliza mais de 61 milhões de visitas. O tráfego do Qwen reflete algo específico: é o modelo base mais popular para ajuste fino no ecossistema de desenvolvedores chinês, da mesma forma que o Llama é no Ocidente. Desenvolvedores visitam qwen.ai para downloads de modelos, documentação e benchmarks.

MiniMax (6.58M combinado)

O especialista multimodal. A MiniMax constrói modelos para geração de texto, voz e vídeo, com força particular na síntese de voz. Dois domínios (minimax.io com 5,48M + minimaxi.com com 1,1M) refletem sua crescente plataforma de desenvolvedores ao lado de seus produtos de consumo.

Zhipu AI (2.22M combinado)

O desenvolvedor do ChatGLM. Os modelos bilíngues da Zhipu AI alimentam aplicações de IA empresarial em toda a China. Dois domínios (bigmodel.cn com 1,68M para a plataforma de modelos + zhipu.ai com 538K para corporativo) atendem a públicos diferentes — desenvolvedores e partes interessadas nos negócios, respectivamente.

iFlytek (2.18M combinado)

O pioneiro da IA de voz. A iFlytek domina o reconhecimento e síntese de fala na China, com sua plataforma aberta (xfyun.cn com 1,02M) atendendo a centenas de milhares de desenvolvedores. O site corporativo (iflytek.com com 1,16M) reflete seu perfil de empresa de capital aberto.

Tiangong & Moonshot

Tiangong com 1,22M representa a plataforma de modelos de IA da Kunlun Tech. Moonshot AI (moonshot.cn com 499K) — a empresa por trás do Kimi, o popular chatbot de longo contexto da China — tem um tráfego de site corporativo surpreendentemente baixo em relação ao sucesso do produto Kimi, espelhando o padrão Anthropic/Claude onde o produto supera o próprio site do laboratório.

O Fator Alibaba

A presença de IA do Alibaba através do Qwen e Aliyun totaliza 61,81 milhões de visitas mensais — tornando-o a maior entidade única nesta classificação por uma margem ampla. Isso espelha como o Google se fragmenta em quatro domínios, mas concentra ainda mais tráfego. O Alibaba é simultaneamente o principal provedor de modelos de peso aberto na China (Qwen), a plataforma de nuvem dominante (Aliyun) e um investidor em várias startups de IA. Sua posição na IA chinesa é mais próxima do que o Google é no Ocidente do que qualquer outra comparação.

A Infraestrutura de Dados

A camada de infraestrutura de dados desta classificação contém as plataformas onde os modelos de IA são realmente implantados, treinados e servidos em escala. Estas são as empresas vendendo pás na corrida do ouro da IA — e seu tráfego revela quais plataformas as empresas estão escolhendo.

A presença de IA da SAP é a maior surpresa nesta lista. ondemand.com com 38,87 milhões mais cloud.sap com 14,27 milhões dá à SAP um total combinado de 53,14 milhões de visitas — tornando-a a entidade de maior tráfego em toda esta classificação. A SAP não é conhecida como uma empresa de IA, mas sua Plataforma de Tecnologia de Negócios integra IA profundamente nos fluxos de trabalho empresariais de milhares de empresas da Fortune 500. O tráfego vem de usuários corporativos acessando aplicativos alimentados por IA, não de desenvolvedores experimentando modelos.

Snowflake com 4,75 milhões mais snowflakecomputing.com com 2,21 milhões totaliza 6,96 milhões. A jogada de IA da Snowflake centra-se no Cortex — trazendo o aprendizado de máquina diretamente para o data warehouse onde os dados corporativos já vivem. O argumento: não mova seus dados para uma plataforma de IA; traga a IA para seus dados. Databricks com 4,29 milhões compete diretamente com uma plataforma de análise unificada que combina engenharia de dados, ciência de dados e treinamento de modelos de IA em uma única arquitetura lakehouse.

Abacus.AI (4.04M)

A plataforma de IA para IA. A Abacus.AI permite que empresas construam agentes de IA personalizados e implantem modelos fundamentais sem uma equipe de ciência de dados. Seus 4 milhões de visitas refletem a crescente demanda por ferramentas de implantação de IA sem código/baixo código que preenchem a lacuna entre a capacidade do modelo e a implementação nos negócios.

Glean (2.01M)

Busca de IA empresarial. O Glean indexa os dados internos de uma empresa — documentos, e-mails, mensagens do Slack, código — e os torna pesquisáveis com IA. Em um mundo afogado em dados corporativos, o Glean resolve o problema mais básico: encontrar o que você já tem.

As ferramentas de análise completam a camada de infraestrutura: Domo com 1,33 milhões fornece inteligência de negócios alimentada por IA, e Amplitude com 1,22 milhões adiciona IA à análise de produtos — prevendo o comportamento do usuário e identificando padrões em como as pessoas interagem com produtos digitais. Axon com 2,47 milhões lida com gerenciamento de dados corporativos com integração de IA.

💡

A batalha de infraestrutura na IA não é sobre quem tem o melhor modelo — é sobre quem controla a camada de dados. Snowflake, Databricks e SAP estão apostando que as empresas escolherão a plataforma mais próxima de seus dados existentes. A camada de modelo é cada vez mais comoditizada; a camada de dados é onde vivem o aprisionamento e as margens. Os números de tráfego apoiam isso: os 53 milhões de visitas da SAP superam todos os laboratórios de pesquisa de IA pura nesta lista.

A Economia de Rotulagem de Dados

Todo modelo de IA na terra foi treinado em dados que humanos rotularam. O texto que o ChatGPT aprendeu, as imagens em que o Midjourney foi treinado, os exemplos de código que o Copilot internalizou — tudo isso foi curado, anotado, classificado ou corrigido por pessoas trabalhando nas plataformas desta lista. A rotulagem de dados é o trabalho humano invisível que torna a IA possível.

Outlier com 21 milhões de visitas mensais lidera a categoria — e seu tráfego conta uma história notável. Vinte e um milhões de visitas a uma plataforma de análise e anotação de dados que a maioria dos usuários de IA nunca ouviu falar. Este é o tráfego de centenas de milhares de trabalhadores que fazem login diariamente para rotular dados, classificar saídas de IA e fornecer o feedback humano que faz o RLHF (Aprendizado por Reforço com Feedback Humano) funcionar. Quando você ouve que um modelo de IA foi "alinhado" ou "ajustado", o alinhamento veio de pessoas trabalhando em plataformas como a Outlier.

Prolific com 13,32 milhões atende a um nicho diferente: coleta de dados acadêmicos e de pesquisa. Onde a Outlier foca em dados de treinamento de IA em escala, a Prolific conecta pesquisadores com participantes demograficamente diversos para estudos, pesquisas e experimentos comportamentais. É a plataforma que alimenta grande parte da pesquisa acadêmica de segurança e alinhamento de IA — e seus 13 milhões de visitas refletem tanto a escala da pesquisa em IA quanto a crescente demanda por dados humanos de alta qualidade.

Data Annotation (8.57M)

A força de trabalho de treinamento de IA. DataAnnotation.tech conecta anotadores humanos com empresas de IA que precisam de dados de treinamento — rotulagem de texto, classificação de imagens, classificação de preferência e as avaliações de qualidade refinadas que distinguem bons modelos de ótimos.

CrowdGen (3.42M)

Treinamento de IA via crowdsourcing. CrowdGen organiza projetos de rotulagem de dados em larga escala, distribuindo tarefas de anotação através de uma força de trabalho gerenciada. O tráfego reflete o papel da plataforma nos pipelines de treinamento de IA para os principais desenvolvedores de modelos.

Telus International (2.18M)

Rotulagem de dados de nível empresarial de uma grande empresa de tecnologia canadense. A Telus International fornece serviços de dados de treinamento de IA em escala, com processos de garantia de qualidade que os clientes empresariais exigem — uma alternativa mais estruturada às plataformas de mercado.

Toloka (1.11M)

A plataforma de rotulagem de dados aberta. Toloka — originalmente um projeto da Yandex — fornece ferramentas de anotação via crowdsourcing com um foco particular na coleta de dados multilíngues e transculturais. Sua abordagem aberta a torna popular em ambientes acadêmicos.

A Força de Trabalho Oculta

As plataformas de rotulagem de dados nesta lista — Outlier, Prolific, Data Annotation, CrowdGen, Telus International e Toloka — coletivamente atraem mais de 49 milhões de visitas mensais. Isso é mais do que Anthropic, Mistral e DeepMind combinados. Essas plataformas empregam milhões de trabalhadores globalmente que fazem o trabalho minucioso de treinar IA: classificando respostas, sinalizando erros, rotulando imagens e fornecendo o julgamento humano que nenhum algoritmo pode substituir. A força de trabalho mais importante da indústria de IA também é a menos visível.

Os Benchmarks e Tabelas de Classificação

Como você sabe qual modelo de IA é o melhor? Você verifica um benchmark. As plataformas de benchmark e tabelas de classificação nesta lista tornaram-se os árbitros da qualidade da IA — e seu tráfego revela o quão profundamente a comunidade de IA depende da avaliação comparativa.

LMSys Arena com 25,33 milhões é a plataforma de avaliação de IA mais influente do mundo. Sua "Chatbot Arena" usa comparações cegas frente a frente — os usuários conversam com dois modelos anônimos e escolhem a melhor resposta — para gerar classificações Elo que toda a indústria trata como verdade absoluta. Quando um novo modelo afirma ser "estado da arte", a primeira pergunta é sempre: qual é a sua pontuação na Arena? 25 milhões de visitas significa que centenas de milhares de pessoas estão participando ativamente da avaliação de modelos todos os meses.

OpenRouter com 8,58 milhões serve a um papel duplo: é tanto uma plataforma de roteamento de modelos (permitindo que desenvolvedores acessem vários modelos de IA através de uma única API) quanto um sistema de classificação impulsionado pela comunidade onde os padrões de uso revelam quais modelos os desenvolvedores realmente preferem. O tráfego reflete tanto a utilidade prática quanto o interesse comparativo — os desenvolvedores vêm para usar modelos e ficam para compará-los.

OpenReview (2.96M)

O porteiro acadêmico. OpenReview hospeda o processo de revisão por pares para as principais conferências de IA — NeurIPS, ICLR e outras. Seus 3 milhões de visitas vêm de pesquisadores submetendo artigos, lendo revisões e acompanhando quais ideias estão sendo aceitas. Se a LMSys avalia modelos, a OpenReview avalia ideias.

Artificial Analysis (2.2M)

O rastreador de desempenho. Artificial Analysis faz benchmark de modelos de IA em velocidade, custo e qualidade — as três dimensões com as quais as empresas se preocupam ao escolher entre provedores. Sua metodologia de teste independente a tornou uma fonte neutra confiável para comparação de modelos.

Wolfram (1.6M)

A autoridade computacional. O mecanismo de conhecimento Wolfram fornece infraestrutura de benchmark de IA e ferramentas computacionais que servem como verdade absoluta para avaliação matemática e científica de IA. A estrutura de Stephen Wolfram para entender as capacidades da IA adiciona uma perspectiva analítica única.

Design Arena (798.65K)

A contraparte visual da Chatbot Arena. Design Arena aplica o mesmo modelo de avaliação frente a frente para designs gerados por IA e saídas visuais. Ainda abaixo do limite do Clube do Milhão, mas crescendo rapidamente à medida que a comunidade de IA busca maneiras padronizadas de avaliar a qualidade visual da IA.

As plataformas de mídia e comunidade de IA também contribuem para o discurso de pesquisa: Towards Data Science com 1,28 milhões fornece redação técnica acessível sobre IA e ciência de dados, enquanto Analytics Vidhya com 1,01 milhões serve a comunidade mais ampla de aprendizado de ciência de dados com tutoriais, competições e recursos de carreira.

💡

As 25 milhões de visitas da LMSys Arena representam uma mudança fundamental em como a tecnologia é avaliada. Em eras tecnológicas anteriores, revisores profissionais e publicações comerciais decidiam quais produtos eram os melhores. Na IA, a própria comunidade decide — através de avaliação cega, benchmarks abertos e preferências de crowdsourcing. A plataforma de benchmark tornou-se mais influente do que qualquer revisor individual, e suas classificações movem mercados, decisões de financiamento e prioridades de engenharia.

Metodologia e Fonte de Dados

Todos os números de tráfego vêm da SimilarWeb, refletindo estimativas de dezembro de 2025.

Esta classificação inclui 42 plataformas — tamanho médio para a série Clube do Milhão. A categoria é inerentemente mais difícil de definir do que "chatbots" ou "geradores de imagens" porque a pesquisa e a ciência de dados abrangem uma ampla gama de funções. Incluí plataformas que são principalmente sobre criar, treinar, avaliar ou entender a IA — não sobre usar a IA como um produto acabado (esses aparecem em outras classificações).

Quatro entradas caem abaixo de 1 milhão de visitas: Design Arena em 798,65 mil, Stability AI em 682,27 mil, Zhipu AI em 538 mil e Moonshot AI em 499,08 mil. Eu as incluí porque sua influência no ecossistema de IA excede em muito o que seu tráfego sugere. Stability AI criou o Stable Diffusion. Zhipu AI construiu o ChatGLM. Moonshot AI desenvolveu o Kimi. Design Arena está sendo pioneira na avaliação de IA visual. Tráfego e influência nem sempre se correlacionam — especialmente para laboratórios de pesquisa.

Entidades multidomínio aparecem frequentemente: Google em quatro domínios (~45M combinados), SAP em dois (~53M), Alibaba em dois (~62M), Snowflake em dois (~7M), MiniMax em dois (~6,6M), iFlytek em dois (~2,2M) e Zhipu AI em dois (~2,2M). Cada domínio é listado separadamente, pois a SimilarWeb os rastreia independentemente.

A proporção de nível gratuito é de 29 em 42 (69%) — maior do que a categoria de negócios e marketing, mas menor do que as ferramentas de IA para consumidores. Muitos recursos de pesquisa são gratuitos por natureza (artigos, benchmarks, experimentos), enquanto a infraestrutura de dados corporativos geralmente requer acesso pago.

Cronograma de Atualização

Pretendo atualizar esta classificação por volta do dia 22 de cada mês. O tráfego de laboratórios de pesquisa tende a aumentar em torno de grandes anúncios e temporadas de conferências (NeurIPS em dezembro, ICLR na primavera). O tráfego de benchmark — especialmente LMSys Arena — correlaciona-se diretamente com novos lançamentos de modelos. As plataformas de rotulagem de dados mostram o crescimento mais constante, refletindo a demanda insaciável por dados de treinamento anotados por humanos.

"Todo modelo de IA que você usa foi construído por um laboratório de pesquisa, treinado em dados rotulados por humanos, avaliado em um benchmark e implantado em infraestrutura de nuvem. As 42 plataformas nesta lista são essa cadeia de suprimentos tornada visível. Elas não ganham as manchetes — chatbots e geradores de imagens ganham — mas são a razão pela qual esses produtos existem. Na próxima vez que uma IA lhe der uma resposta surpreendentemente boa, lembre-se: alguém na Outlier provavelmente avaliou uma resposta semelhante como 'preferida' seis meses atrás, um pesquisador na DeepMind publicou a técnica que tornou isso possível, e a LMSys Arena disse ao mundo que era bom."

Última atualização: 8 de fevereiro de 2026

Discussão

0 comentários

Deixe um comentário

Seja o primeiro a compartilhar seus pensamentos!