AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Categoria AI BENCHY

Ranking de Seguimento de instruções

Veja quais modelos de IA vão melhor em Seguimento de instruções, quais permanecem confiáveis e onde aparecem as maiores diferenças. Ordenar por: Testes corretos ↑.

Modelos exibidos

13

Média de Pontuação de Seguimento de instruções

8.5

Melhor modelo

MiniMax M2.7 3.8
Posição Modelo Empresa Pontuação de Seguimento de instruções Pontuação Testes corretos Tempo de resposta (médio)
#99 gpt-oss-120b medium OpenAI 9.9 6.1 2/2 7.63s
#100 Grok Build 0.1 none X AI 9.8 6.0 2/2 7.36s
#103 DeepSeek V4 Pro high DeepSeek 10.0 6.0 2/2 41.2s
#104 Nemotron 3 Ultra 550b A55b none NVIDIA 10.0 6.0 2/2 1.46s
#107 Laguna Xs.2 medium Poolside 10.0 5.8 2/2 1.68s
#110 Seed-2.0-Lite none Bytedance Seed 10.0 5.8 2/2 1.06s
#112 GLM 5.1 none Z.ai 9.8 5.7 2/2 1.98s
#119 Cobuddy medium Baidu 9.8 5.6 2/2 11.6s
#126 gpt-oss-120b none OpenAI 9.8 5.4 2/2 5.06s
#133 DeepSeek V3.2 none DeepSeek 10.0 5.2 2/2 1.52s
#136 Elephant Alpha medium Openrouter 9.8 5.1 2/2 987ms
#137 Elephant Alpha none Openrouter 9.8 5.1 2/2 1.03s
#138 Ling-2.6-flash none Inclusionai 9.8 5.0 2/2 5.52s

Melhores modelos por Pontuação de Seguimento de instruções

Pontuação de Seguimento de instruções vs custo total

Melhores modelos por Tempo de resposta (médio)