AI BENCHY Compare

xAI: Grok 4.20 vs Xiaomi: MiMo-V2-Omni

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-10

Metrică	Grok 4.20 Grok 4.20 medium Lansare: 2026-03-31	MiMo-V2-Omni MiMo-V2-Omni none Lansare: 2026-03-18

Metrică	Grok 4.20 Grok 4.20 medium Lansare: 2026-03-31	MiMo-V2-Omni MiMo-V2-Omni none Lansare: 2026-03-18
Scor	6.9	6.3
Rang	#68	#81
Fiabilitate	10.0	10.0
Consistență	8.3	9.7
Teste corecte
Rată de trecere pe încercare	63.2%	43.9%
Teste instabile	4	1
Rulări totale	57	49
Cost per rezultat	7.559	0.241
Cost total	$0.756	$0.020
Preț de intrare	$1.250 / 1M	$0.400 / 1M
Preț de ieșire	$2.500 / 1M	$2.000 / 1M
Tokenuri de ieșire	1,784	2,254
Tokenuri de raționament	128,233	0
Timp de răspuns (mediu)	14.53s	2.37s
Timp de răspuns (maxim)	63.48s	6.81s
Timp de răspuns (total)	276.06s	45.03s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Grok 4.20	8.2	7.9	83.3%	1		3.95s	287	8,312
MiMo-V2-Omni	3.6	8.4	8.3%	1		1.63s	773	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Grok 4.20	4.3	1.1	66.7%	1		24.33s	250	12,804
MiMo-V2-Omni	6.6	10.0	0.0%	0		1.72s	399	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Grok 4.20	10.0	10.0	100.0%	0		17.40s	232	9,556
MiMo-V2-Omni	3.0	10.0	0.0%	0		5.96s	387	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Grok 4.20	10.0	10.0	100.0%	0		4.17s	180	5,333
MiMo-V2-Omni	10.0	10.0	100.0%	0		1.76s	147	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Grok 4.20	5.3	10.0	33.3%	0		27.03s	375	49,339
MiMo-V2-Omni	5.3	10.0	33.3%	0		2.10s	24	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Grok 4.20	3.9	2.6	33.3%	1		24.48s	65	6,440
MiMo-V2-Omni	4.1	10.0	0.0%	0		2.33s	103	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Grok 4.20	7.3	6.0	83.3%	1		4.42s	40	5,474
MiMo-V2-Omni	6.5	10.0	50.0%	0		4.26s	30	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Grok 4.20	7.7	10.0	66.7%	0		6.20s	149	7,913
MiMo-V2-Omni	10.0	10.0	100.0%	0		1.16s	148	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Grok 4.20	3.0	10.0	0.0%	0		13.68s	197	6,620
MiMo-V2-Omni	10.0	10.0	100.0%	0		5.40s	231	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Grok 4.20	3.0	10.0	0.0%	0		63.48s	9	16,442
MiMo-V2-Omni	3.0	10.0	0.0%	0		1.30s	12	0

Comparație rapidă

Schimbă perechea de comparație

DeepSeek V4 ProhighvsGrok 4.20medium Gemma 4 31BnoneDisponibil gratuitvsGrok 4.20medium Mercury 2mediumvsMiMo-V2-Omninone Gemini 3.1 Flash LiteminimalvsGrok 4.20medium GPT-5 NanomediumvsMiMo-V2-Omninone GPT-5.5nonevsGrok 4.20medium Grok 4.1 FastmediumvsMiMo-V2-Omninone Gemini 3.1 Flash LitenonevsGrok 4.20medium Nemotron 3 SupermediumDisponibil gratuitvsMiMo-V2-Omninone Qwen3.5 Plus 2026-02-15nonevsGrok 4.20medium Owl AlphamediumvsMiMo-V2-Omninone Claude Sonnet 4.6nonevsGrok 4.20medium