Navigation
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Modèles comparés

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-04-26

Métrique MiMo-V2.5 MiMo-V2.5 medium Sortie: 2026-04-22 MiMo-V2.5-Pro MiMo-V2.5-Pro medium Sortie: 2026-04-22 MiMo-V2-Omni MiMo-V2-Omni medium Sortie: 2026-03-18 MiMo-V2-Pro MiMo-V2-Pro medium Sortie: 2026-03-18
Score 7.8 8.1 7.7 8.1
Rang #41 #27 #43 #28
Fiabilité N/D N/D N/D N/D
Cohérence 8.6 8.8 9.9 8.6
Tests corrects
Taux de réussite par tentative 74.1% 75.9% 61.1% 77.8%
Tests instables 3 3 0 3
Exécutions totales 54 54 20 48
Coût par résultat 2.102 1.674 1.383 1.320
Coût total $0.253 $0.201 $0.153 $0.159
Prix d'entrée $0.400 / 1M $1.000 / 1M $0.400 / 1M $1.000 / 1M
Prix de sortie $2.000 / 1M $3.000 / 1M $2.000 / 1M $3.000 / 1M
Jetons de sortie 2,840 2,735 928 2,360
Jetons de raisonnement 116,242 52,571 72,661 38,320
Temps de réponse (moy.) 13.71s 16.17s 16.76s 12.27s
Temps de réponse (max) 86.93s 84.22s 158.78s 64.71s
Temps de réponse (total) 246.73s 291.09s 301.61s 208.56s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
MiMo-V2.5 10.0 10.0 100.0% 0 1.98s 303 2,022
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 2.95s 273 1,363
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.11s 112 402
MiMo-V2-Pro 10.0 10.0 100.0% 0 3.06s 223 1,107
Programmation Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
MiMo-V2.5 10.0 10.0 100.0% 0 31.48s 488 14,813
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 32.58s 543 7,485
MiMo-V2-Omni 4.0 7.9 0.0% 0 68.55s 265 33,660
MiMo-V2-Pro 10.0 10.0 100.0% 0 52.12s 485 11,361
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
MiMo-V2.5 10.0 10.0 100.0% 0 16.86s 363 7,609
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 53.36s 348 11,870
MiMo-V2-Omni 10.0 10.0 100.0% 0 19.29s 131 2,807
MiMo-V2-Pro 4.7 1.6 66.7% 1 64.71s 380 14,186
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
MiMo-V2.5 2.7 5.7 16.7% 1 6.33s 306 5,714
MiMo-V2.5-Pro 7.3 5.8 83.3% 1 18.81s 260 8,383
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.29s 87 323
MiMo-V2-Pro 7.3 5.8 83.3% 1 17.20s 260 7,484
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
MiMo-V2.5 5.3 10.0 33.3% 0 34.53s 507 49,478
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 37.87s 275 17,023
MiMo-V2-Omni 3.0 10.0 0.0% 0 55.12s 13 33,279
MiMo-V2-Pro 5.3 10.0 33.3% 0 6.00s 155 1,048
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
MiMo-V2.5 3.8 2.5 33.3% 1 1.55s 118 170
MiMo-V2.5-Pro 5.1 3.3 33.3% 1 4.27s 150 549
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.86s 58 202
MiMo-V2-Pro 10.0 10.0 100.0% 0 4.06s 198 424
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
MiMo-V2.5 9.9 10.0 100.0% 0 1.80s 88 801
MiMo-V2.5-Pro 9.9 10.0 100.0% 0 2.77s 82 803
MiMo-V2-Omni 8.3 10.0 50.0% 0 4.92s 35 201
MiMo-V2-Pro 9.9 10.0 100.0% 0 3.36s 83 667
Résolution d'énigmes Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
MiMo-V2.5 8.2 7.2 88.9% 1 20.60s 364 33,211
MiMo-V2.5-Pro 6.7 7.9 55.6% 1 5.16s 493 2,187
MiMo-V2-Omni 6.5 10.0 33.3% 0 3.88s 126 481
MiMo-V2-Pro 7.0 7.2 55.6% 1 4.71s 313 1,179
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
MiMo-V2.5 10.0 10.0 100.0% 0 7.29s 303 2,424
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 16.87s 311 2,908
MiMo-V2-Omni 10.0 10.0 100.0% 0 11.07s 101 1,306
MiMo-V2-Pro 10.0 10.0 100.0% 0 8.19s 263 864

Comparaison rapide

Changer la paire de comparaison