AI BENCHY
Your ad here

Categoria AI BENCHY

Ranking de Seguimento de instruções

Veja quais modelos de IA vão melhor em Seguimento de instruções, quais permanecem confiáveis e onde aparecem as maiores diferenças. Ordenar por: Métrica ↑.

Modelos exibidos

15

Média de Pontuação de Seguimento de instruções

8.0

Melhor modelo

Grok 4.1 Fast 3.0
Posição Modelo Empresa Pontuação de Seguimento de instruções Pontuação Testes corretos Tempo de resposta (médio)
#95 Grok 4.1 Fast none X AI 3.0 4.5 0/2 923ms
#80 MiniMax M2.7 medium Minimax 3.7 5.3 0/2 12.6s
#78 Trinity Large Preview none Arcee AI 4.1 5.3 0/2 1.09s
#60 Gemma 4 26B A4B none Google 4.4 6.2 0/2 1.08s
#70 Qwen3.5-122B-A10B none Qwen 4.5 5.7 0/2 585ms
#67 Qwen3.5-27B none Qwen 4.8 5.9 0/2 815ms
#79 Grok 4.20 Beta none X AI 4.8 5.3 0/2 687ms
#82 Grok 4.20 none X AI 4.8 5.2 0/2 455ms
#87 Qwen3 Coder Next none Qwen 4.8 5.1 0/2 7.71s
#89 GPT-4o-mini none OpenAI 4.8 4.9 0/2 1.27s
#92 Qwen3 Coder Next medium Qwen 4.8 4.7 0/2 7.34s
#98 LFM2-24B-A2B none Liquid 4.8 4.1 0/2 1.09s
#88 Nemotron 3 Super none NVIDIA 4.9 5.1 0/2 1.50s
#96 GPT-5.4 Nano none OpenAI 5.0 4.5 0/2 787ms
#93 GLM 4.7 Flash medium Z.ai 6.2 4.6 1/2 2.97s

Melhores modelos por Pontuação de Seguimento de instruções

Pontuação de Seguimento de instruções vs custo total

Melhores modelos por Tempo de resposta (médio)