AI BENCHY Compare

Qwen: Qwen3.6 Max Preview vs Xiaomi: MiMo-V2.5-Pro

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-05-08

Métrique	Qwen3.6 Max Preview Qwen3.6 Max Preview medium Sortie: 2026-04-20	MiMo-V2.5-Pro MiMo-V2.5-Pro medium Sortie: 2026-04-22

Métrique	Qwen3.6 Max Preview Qwen3.6 Max Preview medium Sortie: 2026-04-20	MiMo-V2.5-Pro MiMo-V2.5-Pro medium Sortie: 2026-04-22
Score	8.5	8.1
Rang	#9	#18
Fiabilité	10.0	10.0
Cohérence	9.6	9.2
Tests corrects
Taux de réussite par tentative	80.7%	74.1%
Tests instables	1	2
Exécutions totales	57	54
Coût par résultat	5.808	1.661
Coût total	$0.872	$0.200
Prix d'entrée	$1.040 / 1M	$1.000 / 1M
Prix de sortie	$6.240 / 1M	$3.000 / 1M
Jetons de sortie	2,186	2,790
Jetons de raisonnement	105,156	52,001
Temps de réponse (moy.)	48.96s	16.23s
Temps de réponse (max)	186.74s	84.22s
Temps de réponse (total)	930.20s	292.10s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		22.13s	228	10,075
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		3.26s	323	1,179

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		117.87s	368	13,790
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		32.58s	543	7,485

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		121.49s	390	14,575
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		53.36s	348	11,870

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		41.15s	270	10,106
MiMo-V2.5-Pro	7.3	5.8	83.3%	1		18.81s	260	8,383

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 Max Preview	2.9	7.2	11.1%	1		95.91s	60	30,371
MiMo-V2.5-Pro	5.3	10.0	33.3%	0		37.87s	275	17,023

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		32.24s	129	3,510
MiMo-V2.5-Pro	5.5	10.0	0.0%	0		4.02s	155	163

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		24.31s	103	5,848
MiMo-V2.5-Pro	9.9	10.0	100.0%	0		2.77s	82	803

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		24.19s	301	7,649
MiMo-V2.5-Pro	6.7	7.9	55.6%	1		5.16s	493	2,187

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		18.32s	309	1,571
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		16.87s	311	2,908

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Qwen3.6 Max Preview	3.0	10.0	0.0%	0		60.56s	28	7,661
MiMo-V2.5-Pro	-	-	-	-	-	-	-	-

Comparaison rapide

Changer la paire de comparaison

Gemini 3 Flash PreviewnonevsMiMo-V2.5-Promedium Gemini 3.1 Flash Lite PreviewlowvsMiMo-V2.5-Promedium Gemini 3 Flash PreviewlowvsQwen3.6 Max Previewmedium GPT-5.5lowvsQwen3.6 Max Previewmedium Gemini 3.1 Flash Lite PreviewnonevsMiMo-V2.5-Promedium GPT-5.2 ChatnonevsMiMo-V2.5-Promedium Gemini 3.1 Flash LitelowvsMiMo-V2.5-Promedium GPT-5.3 ChatnonevsMiMo-V2.5-Promedium DeepSeek V4 FlashhighvsMiMo-V2.5-Promedium Gemini 3 Flash PreviewnonevsQwen3.6 Max Previewmedium Gemini 3.1 Flash Lite PreviewlowvsQwen3.6 Max Previewmedium Gemini 3 Flash PreviewlowvsMiMo-V2.5-Promedium