AI BENCHY Compare

OpenAI: GPT-5.3 Chat vs Xiaomi: MiMo-V2-Pro

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-05-08

Métrique	GPT-5.3 Chat GPT-5.3 Chat none Sortie: 2026-03-03	MiMo-V2-Pro MiMo-V2-Pro medium Sortie: 2026-03-18

Métrique	GPT-5.3 Chat GPT-5.3 Chat none Sortie: 2026-03-03	MiMo-V2-Pro MiMo-V2-Pro medium Sortie: 2026-03-18
Score	7.6	7.7
Rang	#46	#37
Fiabilité	10.0	9.4
Cohérence	8.7	8.2
Tests corrects
Taux de réussite par tentative	70.2%	77.2%
Tests instables	3	4
Exécutions totales	57	57
Coût par résultat	2.895	1.767
Coût total	$0.348	$0.212
Prix d'entrée	$1.750 / 1M	$1.000 / 1M
Prix de sortie	$14.000 / 1M	$3.000 / 1M
Jetons de sortie	21,353	2,514
Jetons de raisonnement	0	55,816
Temps de réponse (moy.)	5.80s	16.18s
Temps de réponse (max)	18.33s	82.71s
Temps de réponse (total)	110.27s	307.48s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
GPT-5.3 Chat	6.7	8.1	58.3%	1		3.86s	3,167	0
MiMo-V2-Pro	10.0	10.0	100.0%	0		2.86s	251	1,154

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
GPT-5.3 Chat	10.0	10.0	100.0%	0		9.32s	1,436	0
MiMo-V2-Pro	10.0	10.0	100.0%	0		52.12s	485	11,361

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
GPT-5.3 Chat	10.0	10.0	100.0%	0		11.96s	2,614	0
MiMo-V2-Pro	4.7	1.6	66.7%	1		64.71s	380	14,186

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
GPT-5.3 Chat	10.0	10.0	100.0%	0		2.21s	942	0
MiMo-V2-Pro	7.3	5.8	83.3%	1		17.20s	260	7,484

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
GPT-5.3 Chat	3.5	4.4	33.3%	2		13.01s	8,264	0
MiMo-V2-Pro	5.3	10.0	33.3%	0		8.82s	170	2,158

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
GPT-5.3 Chat	4.6	10.0	0.0%	0		1.99s	319	0
MiMo-V2-Pro	10.0	10.0	100.0%	0		4.92s	184	400

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
GPT-5.3 Chat	9.8	10.0	100.0%	0		3.29s	1,455	0
MiMo-V2-Pro	9.9	10.0	100.0%	0		3.36s	83	667

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
GPT-5.3 Chat	10.0	10.0	100.0%	0		2.93s	1,726	0
MiMo-V2-Pro	6.4	4.4	77.8%	2		5.26s	410	1,700

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
GPT-5.3 Chat	10.0	10.0	100.0%	0		8.36s	861	0
MiMo-V2-Pro	10.0	10.0	100.0%	0		8.19s	263	864

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
GPT-5.3 Chat	3.0	10.0	0.0%	0		4.38s	569	0
MiMo-V2-Pro	3.0	10.0	0.0%	0		82.71s	28	15,842

Comparaison rapide

Changer la paire de comparaison

GPT-5.3 ChatnonevsGLM 5.1medium DeepSeek V4 FlashhighvsGPT-5.3 Chatnone GPT-5.3 ChatnonevsQwen3.5-Flashmedium Gemini 3.1 Flash LitelowvsGPT-5.3 Chatnone GPT-5.3 ChatnonevsStep 3.5 Flashmedium Gemini 3.1 Flash Lite PreviewnonevsMiMo-V2-Promedium GPT-5.3 ChatnonevsGLM 5V Turbomedium Kimi K2.6mediumvsGPT-5.3 Chatnone GPT-5.3 ChatnonevsQwen3.6 Flashmedium GPT-5.2 ChatnonevsMiMo-V2-Promedium Gemini 3.1 Flash LitelowvsMiMo-V2-Promedium Gemini 3.1 Flash Lite PreviewlowvsMiMo-V2-Promedium