Navigation
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.3 Chat vs Xiaomi: MiMo-V2-Pro

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-05-08

Métrique GPT-5.3 Chat GPT-5.3 Chat none Sortie: 2026-03-03 MiMo-V2-Pro MiMo-V2-Pro medium Sortie: 2026-03-18
Score 7.6 7.7
Rang #46 #37
Fiabilité 10.0 9.4
Cohérence 8.7 8.2
Tests corrects
Taux de réussite par tentative 70.2% 77.2%
Tests instables 3 4
Exécutions totales 57 57
Coût par résultat 2.895 1.767
Coût total $0.348 $0.212
Prix d'entrée $1.750 / 1M $1.000 / 1M
Prix de sortie $14.000 / 1M $3.000 / 1M
Jetons de sortie 21,353 2,514
Jetons de raisonnement 0 55,816
Temps de réponse (moy.) 5.80s 16.18s
Temps de réponse (max) 18.33s 82.71s
Temps de réponse (total) 110.27s 307.48s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 3,167 0
MiMo-V2-Pro 10.0 10.0 100.0% 0 2.86s 251 1,154
Programmation Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
GPT-5.3 Chat 10.0 10.0 100.0% 0 9.32s 1,436 0
MiMo-V2-Pro 10.0 10.0 100.0% 0 52.12s 485 11,361
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 2,614 0
MiMo-V2-Pro 4.7 1.6 66.7% 1 64.71s 380 14,186
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 942 0
MiMo-V2-Pro 7.3 5.8 83.3% 1 17.20s 260 7,484
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 8,264 0
MiMo-V2-Pro 5.3 10.0 33.3% 0 8.82s 170 2,158
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 319 0
MiMo-V2-Pro 10.0 10.0 100.0% 0 4.92s 184 400
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
GPT-5.3 Chat 9.8 10.0 100.0% 0 3.29s 1,455 0
MiMo-V2-Pro 9.9 10.0 100.0% 0 3.36s 83 667
Résolution d'énigmes Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.93s 1,726 0
MiMo-V2-Pro 6.4 4.4 77.8% 2 5.26s 410 1,700
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 861 0
MiMo-V2-Pro 10.0 10.0 100.0% 0 8.19s 263 864
Culture générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
GPT-5.3 Chat 3.0 10.0 0.0% 0 4.38s 569 0
MiMo-V2-Pro 3.0 10.0 0.0% 0 82.71s 28 15,842

Comparaison rapide

Changer la paire de comparaison