AI BENCHY
Your ad here

Categoria AI BENCHY

Ranking de Específico do domínio

Veja quais modelos de IA vão melhor em Específico do domínio, quais permanecem confiáveis e onde aparecem as maiores diferenças. Ordenar por: Testes corretos ↓.

Modelos exibidos

15

Média de Pontuação de Específico do domínio

4.8

Posição Modelo Empresa Pontuação de Específico do domínio Pontuação Testes corretos Tempo de resposta (médio)
#1 Gemini 3 Flash Preview medium Google 10.0 10.0 3/3 21.1s
#2 Gemini 3.1 Pro Preview medium Google 7.7 9.6 2/3 32.7s
#3 Claude Opus 4.7 medium Anthropic 7.7 9.2 2/3 1.17s
#4 Claude Opus 4.7 none Anthropic 7.7 9.2 2/3 1.19s
#14 Gemma 4 31B medium Google 7.7 8.3 2/3 38.5s
#21 Gemini 3 Flash Preview none Google 7.7 8.1 2/3 963ms
#42 Claude Sonnet 4.6 none Anthropic 7.7 7.4 2/3 3.54s
#48 Gemma 4 31B none Google 7.7 6.9 2/3 3.22s
#59 Qwen3.5-Flash none Qwen 7.7 6.2 2/3 905ms
#63 Qwen3.5-35B-A3B none Qwen 7.7 6.1 2/3 485ms
#74 GLM 4.7 Flash none Z.ai 7.7 5.6 2/3 744ms
#5 Gemini 3 Flash Preview low Google 5.3 8.8 1/3 8.05s
#6 Seed-2.0-Lite medium Bytedance Seed 5.9 8.6 1/3 88.7s
#7 GPT-5.3-Codex medium OpenAI 5.9 8.6 1/3 64.3s
#8 Qwen3.5 Plus 2026-02-15 medium Qwen 5.3 8.5 1/3 17.5s

Melhores modelos por Pontuação de Específico do domínio

Pontuação de Específico do domínio vs custo total

Melhores modelos por Tempo de resposta (médio)