AI BENCHY
Comparar
❤️ Made by XCS

Nome do modelo

OpenAI: GPT-4o-mini

Benchmarks gerados a partir das suítes de teste do Aibenchy em : 19 de fev. de 2026

Métrica OpenAI: GPT-4o-mini
Posição#19
EmpresaOpenAI
Score 4.00
Consistência 9.98
Custo por resultado 0.0576
Custo total $0.00173
Testes corretos 3/12
Taxa de acerto por tentativa 25.0%
Testes instáveis 0
Tokens de saída 570
Tokens de raciocínio 0

Detalhamento por categoria

Categoria Testes totalmente aprovados Score Consistência Taxa de acerto por tentativa Testes instáveis Pontuação de raciocínio Custo
Anti-AI Tricks 0/2 1.00 10.00 0.0% 0 - $0.00005
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 - $0.00115
Domain specific 0/3 1.00 10.00 0.0% 0 - $0.00012
Instructions following 1/2 5.50 10.00 50.0% 0 - $0.00015
Puzzle Solving 0/3 4.00 9.92 0.0% 0 - $0.00028

Modelos comparados

Comparar OpenAI: GPT-4o-mini com...

#18 · Stepfun

StepFun: Step 3.5 Flash

Raciocínio (medium)

Score: 4.92

Consistência: 7.34

Taxa de acerto por tentativa: 58.3%

Testes instáveis: 4

Custo por resultado: 0.0000

Testes corretos: 5/12

Custo total: $0.00000

Comparar

#20 · Z.ai

Z.ai: GLM 4.7 Flash

Raciocínio (medium)

Score: 3.92

Consistência: 6.51

Taxa de acerto por tentativa: 50.0%

Testes instáveis: 5

Custo por resultado: 0.2253

Testes corretos: 4/12

Custo total: $0.00902

Comparar

#17 · MiniMax

MiniMax: MiniMax M2.5

Raciocínio (medium)

Score: 5.08

Consistência: 6.00

Taxa de acerto por tentativa: 61.1%

Testes instáveis: 6

Custo por resultado: 4.0276

Testes corretos: 5/12

Custo total: $0.20138

Comparar

Comparação rápida

Comparar OpenAI: GPT-4o-mini com...