AI BENCHY
Advertise here

Categoria AI BENCHY

Ranking de Específico do domínio

Veja quais modelos de IA vão melhor em Específico do domínio, quais permanecem confiáveis e onde aparecem as maiores diferenças. Ordenar por: Métrica ↑.

Modelos exibidos

15

Média de Pontuação de Específico do domínio

4.8

Melhor modelo

GLM 5 Turbo 2.9
Posição Modelo Empresa Pontuação de Específico do domínio Pontuação Testes corretos Tempo de resposta (médio)
#131 Qwen3.5-122B-A10B none Qwen 5.3 5.3 1/3 465ms
#134 GLM 5 Turbo none Z.ai 5.3 5.2 1/3 1.97s
#135 Kimi K2.5 none Moonshot AI 5.3 5.2 1/3 4.38s
#139 DeepSeek V4 Flash none DeepSeek 5.3 5.0 1/3 19.7s
#140 Qwen3 Coder Next none Qwen 5.3 4.9 1/3 962ms
#142 Mistral Small 4 none Mistral 5.3 4.9 1/3 367ms
#146 Laguna Xs.2 none Poolside 5.3 4.8 1/3 371ms
#150 Qwen3 Coder Next medium Qwen 5.3 4.6 1/3 638ms
#151 Trinity Large Preview none Arcee AI 5.3 4.6 1/3 877ms
#67 MiniMax M3 medium Minimax 5.5 7.1 1/3 233.1s
#86 Grok 4.1 Fast medium X AI 5.8 6.5 1/3 121.8s
#5 Qwen3.7 Max medium Qwen 5.9 9.1 1/3 24.9s
#15 GPT-5.3-Codex medium OpenAI 5.9 8.4 1/3 64.3s
#19 Seed-2.0-Lite medium Bytedance Seed 5.9 8.2 1/3 88.7s
#28 Gemini 2.5 Flash medium Google 5.9 7.8 1/3 37.3s

Melhores modelos por Pontuação de Específico do domínio

Pontuação de Específico do domínio vs custo total

Melhores modelos por Tempo de resposta (médio)