AI BENCHY Compare

xAI: Grok 4.20 Multi-Agent Beta vs Xiaomi: MiMo-V2-Omni

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-03-21

Métrique	Grok 4.20 Multi-Agent Beta Grok 4.20 Multi-Agent Beta medium Sortie: 2026-03-12	MiMo-V2-Omni MiMo-V2-Omni none Sortie: 2026-03-18

Métrique	Grok 4.20 Multi-Agent Beta Grok 4.20 Multi-Agent Beta medium Sortie: 2026-03-12	MiMo-V2-Omni MiMo-V2-Omni none Sortie: 2026-03-18
Score	6.2	6.4
Rang	#47	#43
Cohérence	7.2	10.0
Tests corrects
Taux de réussite par tentative	54.9%	47.1%
Tests instables	6	0
Exécutions totales	51	17
Coût par résultat	82.962	0.069
Coût total	$4.978	$0.006
Prix d'entrée	$2.000 / 1M	$0.400 / 1M
Prix de sortie	$6.000 / 1M	$2.000 / 1M
Jetons de sortie	298,948	469
Jetons de raisonnement	296,529	0
Temps de réponse (moy.)	8.64s	2.01s
Temps de réponse (max)	35.28s	6.81s
Temps de réponse (total)	129.64s	34.09s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Grok 4.20 Multi-Agent Beta	6.9	5.8	75.0%	2		3.46s	33,706	33,077
MiMo-V2-Omni	4.8	10.0	25.0%	0		1.10s	74	0

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Grok 4.20 Multi-Agent Beta	3.0	10.0	0.0%	0		0ms	0	0
MiMo-V2-Omni	3.0	10.0	0.0%	0		2.47s	110	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Grok 4.20 Multi-Agent Beta	10.0	10.0	100.0%	0		5.54s	25,306	25,051
MiMo-V2-Omni	10.0	10.0	100.0%	0		1.69s	83	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Grok 4.20 Multi-Agent Beta	2.9	7.2	11.1%	1		24.67s	164,609	163,647
MiMo-V2-Omni	5.3	10.0	33.3%	0		1.14s	8	0

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Grok 4.20 Multi-Agent Beta	5.8	2.8	66.7%	1		6.40s	15,848	15,746
MiMo-V2-Omni	4.5	10.0	0.0%	0		1.19s	37	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Grok 4.20 Multi-Agent Beta	8.3	10.0	50.0%	0		4.63s	25,457	25,322
MiMo-V2-Omni	6.5	10.0	50.0%	0		4.18s	22	0

Puzzle Solving	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Grok 4.20 Multi-Agent Beta	7.2	5.1	77.8%	2		5.01s	34,022	33,686
MiMo-V2-Omni	8.0	10.0	66.7%	0		2.71s	58	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Grok 4.20 Multi-Agent Beta	3.0	10.0	0.0%	0		0ms	0	0
MiMo-V2-Omni	10.0	10.0	100.0%	0		2.76s	77	0

Comparaison rapide

Changer la paire de comparaison

Mercury 2mediumvsMiMo-V2-Omninone DeepSeek V3.2nonevsGrok 4.20 Multi-Agent Betamedium GPT-5 NanomediumvsMiMo-V2-Omninone Qwen3.5-FlashnonevsGrok 4.20 Multi-Agent Betamedium Seed-2.0-LitenonevsGrok 4.20 Multi-Agent Betamedium Gemini 2.5 FlashnonevsGrok 4.20 Multi-Agent Betamedium Qwen3.5-35B-A3BnonevsGrok 4.20 Multi-Agent Betamedium Hunter AlphanonevsGrok 4.20 Multi-Agent Betamedium GPT-5 MinimediumvsMiMo-V2-Omninone Qwen3.5-122B-A10BnonevsGrok 4.20 Multi-Agent Betamedium gpt-oss-120bmediumDisponible gratuitementvsMiMo-V2-Omninone Grok 4.20 Multi-Agent BetamediumvsMiMo-V2-Pronone