AI BENCHY Compare

MiniMax: MiniMax M2.7 vs xAI: Grok 4.20 Beta

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-03-18

Metrică	MiniMax M2.7 MiniMax M2.7 medium Lansare: 2026-03-18	Grok 4.20 Beta Grok 4.20 Beta none Lansare: 2026-03-12

Metrică	MiniMax M2.7 MiniMax M2.7 medium Lansare: 2026-03-18	Grok 4.20 Beta Grok 4.20 Beta none Lansare: 2026-03-12
Scor	5.0	5.3
Rang	#64	#58
Consistență	5.3	9.1
Teste corecte
Rată de trecere pe încercare	49.0%	31.4%
Teste instabile	10	2
Rulări totale	51	51
Cost per rezultat	2.398	2.240
Cost total	$0.072	$0.090
Preț de intrare	$0.300 / 1M	$2.000 / 1M
Preț de ieșire	$1.200 / 1M	$6.000 / 1M
Tokenuri de ieșire	4,517	1,517
Tokenuri de raționament	47,612	0
Timp de răspuns (mediu)	27.32s	1.19s
Timp de răspuns (maxim)	117.04s	6.48s
Timp de răspuns (total)	437.10s	20.22s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
MiniMax M2.7	7.9	6.3	83.3%	2		40.32s	3,010	17,716
Grok 4.20 Beta	4.0	8.4	16.7%	1		597ms	251	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
MiniMax M2.7	4.7	1.6	66.7%	1		41.03s	369	4,480
Grok 4.20 Beta	3.0	10.0	0.0%	0		6.48s	282	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
MiniMax M2.7	6.3	5.8	66.7%	1		21.95s	187	5,882
Grok 4.20 Beta	10.0	10.0	100.0%	0		601ms	197	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
MiniMax M2.7	3.0	10.0	0.0%	0		19.00s	8	2,796
Grok 4.20 Beta	3.0	10.0	0.0%	0		611ms	160	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
MiniMax M2.7	3.9	2.5	33.3%	1		38.70s	92	5,204
Grok 4.20 Beta	5.0	10.0	0.0%	0		541ms	87	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
MiniMax M2.7	3.7	1.8	50.0%	2		12.64s	213	2,457
Grok 4.20 Beta	4.8	10.0	0.0%	0		687ms	60	0

Puzzle Solving	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
MiniMax M2.7	3.8	4.5	33.3%	2		25.62s	334	8,076
Grok 4.20 Beta	5.9	7.2	55.6%	1		541ms	291	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
MiniMax M2.7	4.7	1.6	66.7%	1		12.05s	304	1,001
Grok 4.20 Beta	10.0	10.0	100.0%	0		4.79s	189	0

Comparație rapidă

Schimbă perechea de comparație

MiniMax M2.7mediumvsQwen3 Coder Nextnone MiniMax M2.7mediumvsGPT-4o-mininone Mercury 2nonevsMiniMax M2.7medium MiniMax M2.7mediumvsGPT-5.4 Mininone MiniMax M2.7mediumvsNemotron 3 Super 120b A12bnoneDisponibil gratuit MiniMax M2.7mediumvsQwen3.5-9Bnone MiniMax M2.7mediumvsMistral Small 4none Mistral Small 4mediumvsGrok 4.20 Betanone Trinity Large PreviewnoneDisponibil gratuitvsMiniMax M2.7medium MiniMax M2.7mediumvsKimi K2.5none Qwen3 Coder NextmediumvsGrok 4.20 Betanone MiniMax M2.7mediumvsGLM 4.7 Flashnone