AI BENCHY Compare

MiniMax: MiniMax M2.7 vs OpenAI: GPT-5.4

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-22

Metrică	MiniMax M2.7 MiniMax M2.7 medium Lansare: 2026-03-18	GPT-5.4 GPT-5.4 none Lansare: 2026-03-05

Metrică	MiniMax M2.7 MiniMax M2.7 medium Lansare: 2026-03-18	GPT-5.4 GPT-5.4 none Lansare: 2026-03-05
Scor	5.0	5.6
Rang	#133	#112
Fiabilitate	8.3	10.0
Consistență	5.9	9.1
Teste corecte
Rată de trecere pe încercare	46.7%	38.3%
Teste instabile	10	2
Rulări totale	60	60
Cost per rezultat	2.593	1.638
Cost total	$0.104	$0.115
Preț de intrare	$0.279 / 1M	$2.500 / 1M
Preț de ieșire	$1.200 / 1M	$15.000 / 1M
Tokenuri de ieșire	8,059	2,378
Tokenuri de raționament	73,466	0
Timp de răspuns (mediu)	29.96s	1.46s
Timp de răspuns (maxim)	117.04s	2.95s
Timp de răspuns (total)	569.33s	29.23s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
MiniMax M2.7	7.9	6.3	83.3%	2		40.32s	3,010	17,716
GPT-5.4	3.2	8.0	8.3%	1		1.21s	406	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
MiniMax M2.7	6.7	9.6	50.0%	0		54.73s	474	22,402
GPT-5.4	6.8	10.0	50.0%	0		1.99s	501	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
MiniMax M2.7	4.7	1.6	66.7%	1		41.03s	369	4,480
GPT-5.4	3.0	10.0	0.0%	0		2.89s	291	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
MiniMax M2.7	6.3	5.8	66.7%	1		21.95s	187	5,882
GPT-5.4	10.0	10.0	100.0%	0		1.04s	222	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
MiniMax M2.7	3.0	10.0	0.0%	0		19.00s	8	2,796
GPT-5.4	5.3	7.2	44.4%	1		1.07s	50	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
MiniMax M2.7	3.9	2.5	33.3%	1		38.70s	92	5,204
GPT-5.4	4.4	9.9	0.0%	0		1.78s	184	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
MiniMax M2.7	3.8	1.6	50.0%	2		12.64s	213	2,457
GPT-5.4	6.5	10.0	50.0%	0		1.07s	81	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
MiniMax M2.7	3.5	4.4	33.3%	2		25.62s	334	8,076
GPT-5.4	5.6	9.8	33.3%	0		1.52s	357	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
MiniMax M2.7	4.7	1.6	66.7%	1		12.05s	304	1,001
GPT-5.4	10.0	10.0	100.0%	0		2.75s	246	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
MiniMax M2.7	3.0	10.0	0.0%	0		22.77s	3,068	3,452
GPT-5.4	3.0	10.0	0.0%	0		990ms	40	0

Comparație rapidă

Schimbă perechea de comparație

MiniMax M2.7mediumvsNemotron 3 SupernoneDisponibil gratuit MiniMax M2.7mediumvsQwen3 Coder Nextnone DeepSeek V4 FlashnoneDisponibil gratuitvsMiniMax M2.7medium MiniMax M2.7mediumvsMistral Small 4none MiniMax M2.7mediumvsGPT-5.4 Mininone MiniMax M2.7mediumvsElephant Alphanone MiniMax M2.7mediumvsgpt-oss-120bnoneDisponibil gratuit MiniMax M2.5mediumDisponibil gratuitvsGPT-5.4none CobuddymediumDisponibil gratuitvsGPT-5.4none Mistral Small 4mediumvsGPT-5.4none MiniMax M2.7mediumvsQwen3.6 35B A3Bnone MiniMax M2.7mediumvsGPT-4o-mininone