AI BENCHY
Your ad here

Categoria AI BENCHY

Ranking de Seguimento de instruções

Veja quais modelos de IA vão melhor em Seguimento de instruções, quais permanecem confiáveis e onde aparecem as maiores diferenças.

Modelos exibidos

15

Média de Pontuação de Seguimento de instruções

8.0

Posição Modelo Empresa Pontuação de Seguimento de instruções Pontuação Testes corretos Tempo de resposta (médio)
#51 Nemotron 3 Super medium NVIDIA 7.2 6.7 1/2 7.72s
#52 Grok 4.1 Fast medium X AI 6.6 6.7 1/2 5.30s
#42 Claude Sonnet 4.6 none Anthropic 6.5 7.4 1/2 1.96s
#48 Gemma 4 31B none Google 6.5 6.9 1/2 2.84s
#55 MiMo-V2-Omni none Xiaomi 6.5 6.5 1/2 4.18s
#58 GLM 5V Turbo none Z.ai 6.5 6.2 1/2 1.97s
#65 MiMo-V2-Pro none Xiaomi 6.5 6.0 1/2 2.51s
#66 GPT-5.4 none OpenAI 6.5 5.9 1/2 1.07s
#69 Kimi K2.6 none Moonshot AI 6.5 5.8 1/2 1.64s
#74 GLM 4.7 Flash none Z.ai 6.5 5.6 1/2 888ms
#76 Kimi K2.5 none Moonshot AI 6.5 5.5 1/2 2.67s
#77 GLM 5 Turbo none Z.ai 6.5 5.5 1/2 2.13s
#83 Mistral Small 4 none Mistral 6.5 5.2 1/2 380ms
#90 Qwen3.5-9B none Qwen 6.5 4.8 1/2 514ms
#91 Mercury 2 none Inception 6.5 4.8 1/2 551ms

Melhores modelos por Pontuação de Seguimento de instruções

Pontuação de Seguimento de instruções vs custo total

Melhores modelos por Tempo de resposta (médio)