Comparar Gráficos

Idioma:

❤️ Made by XCS

AI BENCHY Compare

OpenAI: GPT-4o-mini vs OpenAI: GPT-5.4

Comparar:

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-05

Métrica	OpenAI: GPT-4o-mini none Lançamento: 2024-07-18	OpenAI: GPT-5.4 none Lançamento: 2026-03-05
Posição	#46	#44
Pontuação média	4.1	4.6
Testes corretos
Consistência	10.0	8.9
Custo por resultado	0.111	1.496
Custo total	$0.005	$0.090
Taxa de acerto por tentativa	26.7%	44.4%
Testes instáveis	0	2
common.totalAttempts	45 (15 x 3)	45 (15 x 3)
Tokens de saída	1,528	1,635
Tokens de raciocínio	0	0
Tempo de resposta (médio)	2.21s	1.46s
Tempo de resposta (máx.)	7.58s	2.89s
Tempo de resposta (total)	17.69s	21.86s

Melhores modelos por pontuação

Tempo de resposta (médio)

Pontuação vs custo total

Pontuação média vs Tempo de resposta (médio)

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
OpenAI: GPT-4o-mini	4.0	10.0	33.3%	0		1.83s	180	0
OpenAI: GPT-5.4	10.0	7.3	11.1%	1		1.41s	388	0

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
OpenAI: GPT-4o-mini	10.0	10.0	0.0%	0		7.58s	568	0
OpenAI: GPT-5.4	10.0	10.0	0.0%	0		2.89s	291	0

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
OpenAI: GPT-4o-mini	9.9	10.0	100.0%	0		1.27s	183	0
OpenAI: GPT-5.4	9.9	10.0	100.0%	0		1.04s	222	0

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
OpenAI: GPT-4o-mini	10.0	10.0	0.0%	0		637ms	15	0
OpenAI: GPT-5.4	4.0	7.2	44.4%	1		1.07s	50	0

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
OpenAI: GPT-4o-mini	4.5	10.0	0.0%	0		1.27s	69	0
OpenAI: GPT-5.4	5.5	10.0	50.0%	0		1.07s	81	0

Puzzle Solving	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
OpenAI: GPT-4o-mini	2.3	10.0	0.0%	0		1.30s	308	0
OpenAI: GPT-5.4	4.0	9.8	33.3%	0		1.52s	357	0

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
OpenAI: GPT-4o-mini	10.0	10.0	100.0%	0		2.51s	205	0
OpenAI: GPT-5.4	10.0	10.0	100.0%	0		2.75s	246	0

Comparação rápida

Trocar par de comparação

MiniMax M2.5mediumvsGPT-5.4none MiniMax M2.5mediumvsGPT-4o-mininone GPT-4o-mininonevsQwen3 Coder Nextmedium GPT-4o-mininonevsGLM 4.7 Flashmedium Mercury 2mediumvsGPT-5.4none GPT-5.4nonevsQwen3.5-35B-A3Bmedium GPT-5.4nonevsQwen3 Coder Nextmedium GPT-5.4nonevsGLM 4.7 Flashmedium Mercury 2mediumvsGPT-4o-mininone GPT-4o-mininonevsQwen3.5-35B-A3Bmedium Claude Opus 4.6mediumvsGPT-5.4none Kimi K2.5mediumvsGPT-5.4none