Comparar Gráficos

Idioma:

❤️ Made by XCS

AI BENCHY Compare

MiniMax: MiniMax M2.5 vs OpenAI: GPT-5.4

Comparar:

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-05

Métrica	MiniMax: MiniMax M2.5 medium Lançamento: 2026-02-12	OpenAI: GPT-5.4 none Lançamento: 2026-03-05
Posição	#42	#44
Pontuação média	4.8	4.6
Testes corretos
Consistência	5.8	8.9
Custo por resultado	4.937	1.496
Custo total	$0.247	$0.090
Taxa de acerto por tentativa	62.2%	44.4%
Testes instáveis	8	2
common.totalAttempts	45 (15 x 3)	45 (15 x 3)
Tokens de saída	107,019	1,635
Tokens de raciocínio	204,504	0
Tempo de resposta (médio)	47.58s	1.46s
Tempo de resposta (máx.)	237.27s	2.89s
Tempo de resposta (total)	380.62s	21.86s

Melhores modelos por pontuação

Tempo de resposta (médio)

Pontuação vs custo total

Pontuação média vs Tempo de resposta (médio)

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
MiniMax: MiniMax M2.5	9.3	7.9	88.9%	1		32.42s	286	45,112
OpenAI: GPT-5.4	10.0	7.3	11.1%	1		1.41s	388	0

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
MiniMax: MiniMax M2.5	10.0	2.1	66.7%	1		60.39s	740	9,713
OpenAI: GPT-5.4	10.0	10.0	0.0%	0		2.89s	291	0

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
MiniMax: MiniMax M2.5	10.0	1.7	66.7%	2		7.48s	266	3,835
OpenAI: GPT-5.4	9.9	10.0	100.0%	0		1.04s	222	0

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
MiniMax: MiniMax M2.5	10.0	4.4	22.2%	2		237.27s	105,047	133,487
OpenAI: GPT-5.4	4.0	7.2	44.4%	1		1.07s	50	0

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
MiniMax: MiniMax M2.5	8.0	6.8	83.3%	1		4.64s	252	1,873
OpenAI: GPT-5.4	5.5	10.0	50.0%	0		1.07s	81	0

Puzzle Solving	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
MiniMax: MiniMax M2.5	4.0	7.2	44.4%	1		11.54s	159	9,547
OpenAI: GPT-5.4	4.0	9.8	33.3%	0		1.52s	357	0

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
MiniMax: MiniMax M2.5	10.0	10.0	100.0%	0		15.35s	269	937
OpenAI: GPT-5.4	10.0	10.0	100.0%	0		2.75s	246	0

Comparação rápida

Trocar par de comparação

MiniMax M2.5mediumvsQwen3.5-35B-A3Bnone MiniMax M2.5mediumvsQwen3.5-27Bnone MiniMax M2.5mediumvsQwen3.5-Flashnone MiniMax M2.5mediumvsQwen3.5-122B-A10Bnone DeepSeek V3.2nonevsMiniMax M2.5medium Gemini 2.5 FlashnonevsMiniMax M2.5medium Trinity Large Preview (free)noneDisponível grátisvsMiniMax M2.5medium MiniMax M2.5mediumvsGPT-4o-mininone Mercury 2mediumvsGPT-5.4none MiniMax M2.5mediumvsGLM 4.7 Flashnone MiniMax M2.5mediumvsGLM 5none MiniMax M2.5mediumvsKimi K2.5none