AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs Xiaomi: MiMo-V2-Omni

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-04-07

Métrique	Claude Opus 4.6 Claude Opus 4.6 medium Sortie: 2026-02-05	MiMo-V2-Omni MiMo-V2-Omni none Sortie: 2026-03-18

Métrique	Claude Opus 4.6 Claude Opus 4.6 medium Sortie: 2026-02-05	MiMo-V2-Omni MiMo-V2-Omni none Sortie: 2026-03-18
Score	7.5	6.4
Rang	#35	#51
Cohérence	9.0	10.0
Tests corrects
Taux de réussite par tentative	68.6%	47.1%
Tests instables	2	0
Exécutions totales	51	17
Coût par résultat	11.973	0.069
Coût total	$1.317	$0.006
Prix d'entrée	$5.000 / 1M	$0.400 / 1M
Prix de sortie	$25.000 / 1M	$2.000 / 1M
Jetons de sortie	26,343	469
Jetons de raisonnement	17,434	0
Temps de réponse (moy.)	20.87s	2.01s
Temps de réponse (max)	83.40s	6.81s
Temps de réponse (total)	208.73s	34.09s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Claude Opus 4.6	6.4	5.8	66.7%	2		7.45s	986	1,071
MiMo-V2-Omni	4.8	10.0	25.0%	0		1.10s	74	0

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Claude Opus 4.6	10.0	10.0	100.0%	0		76.66s	8,178	5,194
MiMo-V2-Omni	3.0	10.0	0.0%	0		2.47s	110	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Claude Opus 4.6	10.0	10.0	100.0%	0		7.37s	691	757
MiMo-V2-Omni	10.0	10.0	100.0%	0		1.69s	83	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Claude Opus 4.6	3.0	10.0	0.0%	0		83.40s	14,642	8,687
MiMo-V2-Omni	5.3	10.0	33.3%	0		1.14s	8	0

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Claude Opus 4.6	10.0	10.0	100.0%	0		5.04s	188	292
MiMo-V2-Omni	4.5	10.0	0.0%	0		1.19s	37	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Claude Opus 4.6	10.0	10.0	100.0%	0		2.43s	266	467
MiMo-V2-Omni	6.5	10.0	50.0%	0		4.18s	22	0

Puzzle Solving	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Claude Opus 4.6	7.7	10.0	66.7%	0		4.60s	531	637
MiMo-V2-Omni	8.0	10.0	66.7%	0		2.71s	58	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Claude Opus 4.6	10.0	10.0	100.0%	0		9.73s	861	329
MiMo-V2-Omni	10.0	10.0	100.0%	0		2.76s	77	0

Comparaison rapide

Changer la paire de comparaison

Claude Opus 4.6mediumvsGPT-5.3 Chatnone Mercury 2mediumvsMiMo-V2-Omninone GPT-5 NanomediumvsMiMo-V2-Omninone Grok 4.20 Multi Agent BetamediumvsMiMo-V2-Omninone Claude Opus 4.6mediumvsGPT-5.2 Chatnone Claude Opus 4.6mediumvsGemini 3.1 Flash Lite Previewnone GPT-5 MinimediumvsMiMo-V2-Omninone gpt-oss-120bmediumDisponible gratuitementvsMiMo-V2-Omninone Nemotron 3 SupermediumDisponible gratuitementvsMiMo-V2-Omninone Claude Opus 4.6mediumvsGemini 3 Flash Previewnone Claude Opus 4.6mediumvsGemini 3.1 Flash Lite Previewlow Grok 4.1 FastmediumvsMiMo-V2-Omninone