AI BENCHY Compare

Owl Alpha vs Xiaomi: MiMo-V2.5-Pro

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-04-30

Métrique	Owl Alpha Owl Alpha medium Sortie: 2026-04-30	MiMo-V2.5-Pro MiMo-V2.5-Pro none Sortie: 2026-04-22

Métrique	Owl Alpha Owl Alpha medium Sortie: 2026-04-30	MiMo-V2.5-Pro MiMo-V2.5-Pro none Sortie: 2026-04-22
Score	5.8	5.8
Rang	#91	#94
Fiabilité	10.0	N/D
Cohérence	9.5	8.3
Tests corrects
Taux de réussite par tentative	40.7%	46.3%
Tests instables	1	4
Exécutions totales	54	54
Coût par résultat	0.000	0.535
Coût total	$0.000	$0.033
Prix d'entrée	$0.000 / 1M	$1.000 / 1M
Prix de sortie	$0.000 / 1M	$3.000 / 1M
Jetons de sortie	1,596	2,451
Jetons de raisonnement	0	0
Temps de réponse (moy.)	11.04s	1.51s
Temps de réponse (max)	58.63s	3.54s
Temps de réponse (total)	198.65s	27.21s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Owl Alpha	4.8	10.0	25.0%	0		3.97s	87	0
MiMo-V2.5-Pro	2.9	7.9	8.3%	1		1.29s	366	0

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Owl Alpha	10.0	10.0	100.0%	0		7.35s	402	0
MiMo-V2.5-Pro	6.4	3.3	66.7%	1		2.39s	452	0

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Owl Alpha	3.0	10.0	0.0%	0		10.01s	315	0
MiMo-V2.5-Pro	3.0	10.0	0.0%	0		3.54s	596	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Owl Alpha	10.0	10.0	100.0%	0		21.64s	246	0
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		1.32s	249	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Owl Alpha	5.3	10.0	33.3%	0		8.58s	28	0
MiMo-V2.5-Pro	5.3	10.0	33.3%	0		877ms	27	0

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Owl Alpha	4.3	10.0	0.0%	0		58.63s	98	0
MiMo-V2.5-Pro	4.5	10.0	0.0%	0		1.53s	140	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Owl Alpha	6.3	10.0	50.0%	0		9.59s	57	0
MiMo-V2.5-Pro	6.4	10.0	50.0%	0		1.03s	66	0

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Owl Alpha	3.4	7.2	11.1%	1		3.44s	135	0
MiMo-V2.5-Pro	6.7	4.7	77.8%	2		1.32s	297	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Owl Alpha	10.0	10.0	100.0%	0		8.26s	228	0
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		3.30s	258	0

Comparaison rapide

Changer la paire de comparaison

Kimi K2.6nonevsOwl Alphamedium GPT-5.4nonevsOwl Alphamedium Owl AlphamediumvsQwen3.5-122B-A10Bnone Owl AlphamediumvsQwen3.5 Plus 2026-04-20none gpt-oss-120bmediumDisponible gratuitementvsMiMo-V2.5-Pronone Owl AlphamediumvsQwen3.6 Flashnone Owl AlphamediumvsGLM 5.1none Mistral Small 4mediumvsMiMo-V2.5-Pronone MiniMax M2.5mediumDisponible gratuitementvsMiMo-V2.5-Pronone Owl AlphamediumvsMiMo-V2-Pronone DeepSeek V3.2nonevsOwl Alphamedium Owl AlphamediumvsQwen3.5-27Bnone