Navigation
AI BENCHY
Advertise here

AI BENCHY Compare

Xiaomi: MiMo-V2.5 vs Z.ai: GLM 4.7 Flash

Résumé

Comparaison benchmark MiMo-V2.5 vs GLM 4.7 Flash : MiMo-V2.5 mène au score moyen avec 4.9 vs 4.4. MiMo-V2.5 a le coût de benchmark le plus bas avec $0.007 vs $0.054. MiMo-V2.5 est plus rapide avec 2.20s vs 35.10s, avec des taux de réussite de 27.0% vs 33.3%.

Modèle recommandé: MiMo-V2.5 - Il obtient le meilleur score ici (4.9) tout en coûtant environ 8.2x moins que GLM 4.7 Flash.

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-04

Métrique MiMo-V2.5 MiMo-V2.5 none Sortie: 2026-04-22 GLM 4.7 Flash GLM 4.7 Flash medium Sortie: 2026-01-19
Score 4.9 4.4
Rang #143 #158
Fiabilité 10.0 6.7
Cohérence 9.6 6.8
Tests corrects
Taux de réussite par tentative 27.0% 33.3%
Tests instables 1 8
Exécutions totales 63 63
Coût par résultat 0.413 1.337
Coût total $0.007 $0.054
Prix d'entrée $0.140 / 1M $0.060 / 1M
Prix de sortie $0.280 / 1M $0.400 / 1M
Total des jetons d'entrée 41,985 37,206
Jetons de sortie 2,267 43,754
Jetons de raisonnement 0 89,079
Temps de réponse (moy.) 2.20s 35.10s
Temps de réponse (max) 6.86s 174.55s
Temps de réponse (total) 46.21s 456.24s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#143 MiMo-V2.5

none
Cost
$0.007
Time
267.4s
Tokens
25,283 tok

#158 GLM 4.7 Flash

medium
Invalid SVG
Cost
$0.000
Time
186.2s
Tokens
12,112 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
MiMo-V2.5 3.5 8.0 16.7% 1 2.19s 645 282 0
GLM 4.7 Flash 4.7 5.9 41.7% 2 14.95s 555 1,122 6,110
Programmation Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
MiMo-V2.5 5.5 10.0 33.3% 0 3.24s 7,440 696 0
GLM 4.7 Flash 3.2 7.4 11.1% 1 55.33s 3,106 4,981 22,387
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
MiMo-V2.5 3.0 10.0 0.0% 0 2.36s 15,075 330 0
GLM 4.7 Flash 2.8 2.1 33.3% 1 65.57s 17,185 2,585 20,648
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
MiMo-V2.5 6.5 10.0 50.0% 0 1.01s 7,758 366 0
GLM 4.7 Flash 6.3 10.0 50.0% 0 1.51s 7,107 584 2,755
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
MiMo-V2.5 3.0 10.0 0.0% 0 756ms 753 27 0
GLM 4.7 Flash 3.5 4.4 33.3% 2 174.55s 643 33,000 25,394
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
MiMo-V2.5 4.4 9.9 0.0% 0 6.86s 498 81 0
GLM 4.7 Flash 3.6 9.7 0.0% 0 18.14s 318 18 2,138
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
MiMo-V2.5 6.5 10.0 50.0% 0 751ms 684 72 0
GLM 4.7 Flash 6.2 5.8 66.7% 1 2.97s 636 388 2,181
Résolution d'énigmes Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
MiMo-V2.5 5.4 10.0 33.3% 0 2.13s 678 166 0
GLM 4.7 Flash 2.9 7.2 11.1% 1 12.93s 521 781 5,255
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
MiMo-V2.5 10.0 10.0 100.0% 0 2.43s 8,238 231 0
GLM 4.7 Flash 10.0 10.0 100.0% 0 15.95s 6,949 224 1,014
Culture générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
MiMo-V2.5 3.0 10.0 0.0% 0 3.89s 216 16 0
GLM 4.7 Flash 3.0 10.0 0.0% 0 11.13s 186 71 1,197

Comparaison rapide

Changer la paire de comparaison