AI BENCHY Compare

Qwen: Qwen3.5 Plus 2026-02-15 vs Xiaomi: MiMo-V2.5

Résumé

Comparaison benchmark Qwen3.5 Plus 2026-02-15 vs MiMo-V2.5 : MiMo-V2.5 mène au score moyen avec 6.7 vs 5.8. Qwen3.5 Plus 2026-02-15 a le coût de benchmark le plus bas avec $0.016 vs $0.063. Qwen3.5 Plus 2026-02-15 est plus rapide avec 2.31s vs 27.11s, avec des taux de réussite de 46.0% vs 69.8%.

Modèle recommandé: Qwen3.5 Plus 2026-02-15 - Il offre le meilleur compromis global: score compétitif (5.8), coût inférieur à MiMo-V2.5 et temps de réponse équilibré.

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-18

Métrique	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none Sortie: 2026-02-15	MiMo-V2.5 MiMo-V2.5 medium Sortie: 2026-04-22

Métrique	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none Sortie: 2026-02-15	MiMo-V2.5 MiMo-V2.5 medium Sortie: 2026-04-22
Score	5.8	6.7
Rang	#106	#76
Fiabilité	10.0	10.0
Cohérence	9.4	8.1
Tests corrects
Taux de réussite par tentative	46.0%	69.8%
Tests instables	2	5
Exécutions totales	63	63
Coût par résultat	0.204	2.966
Coût total	$0.016	$0.063
Prix d'entrée	$0.260 / 1M	$0.140 / 1M
Prix de sortie	$1.560 / 1M	$0.280 / 1M
Total des jetons d'entrée	45,864	41,838
Jetons de sortie	2,480	2,827
Jetons de raisonnement	0	198,898
Temps de réponse (moy.)	2.31s	27.11s
Temps de réponse (max)	6.65s	162.44s
Temps de réponse (total)	34.63s	569.38s

Génération showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#106 Qwen3.5 Plus 2026-02-15

none

Coût: $0.012
Temps: 153.2s
Tokens: 7,787 tok

#76 MiMo-V2.5

medium

Coût: $0.002
Temps: 54.8s
Tokens: 5,247 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Qwen3.5 Plus 2026-02-15	4.8	10.0	25.0%	0		1.91s	696	517	0
MiMo-V2.5	10.0	10.0	100.0%	0		4.14s	621	281	1,739

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Qwen3.5 Plus 2026-02-15	4.3	7.9	11.1%	1		2.05s	7,913	473	0
MiMo-V2.5	6.2	4.7	66.7%	2		97.14s	7,422	557	81,977

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Qwen3.5 Plus 2026-02-15	3.0	10.0	0.0%	0		6.65s	18,304	314	0
MiMo-V2.5	10.0	10.0	100.0%	0		16.86s	15,060	363	7,609

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		1.89s	7,794	243	0
MiMo-V2.5	2.7	5.7	16.7%	1		6.33s	7,746	306	5,714

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Qwen3.5 Plus 2026-02-15	5.3	10.0	33.3%	0		1.17s	789	17	0
MiMo-V2.5	5.3	10.0	33.3%	0		34.53s	735	507	49,478

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Qwen3.5 Plus 2026-02-15	4.4	3.0	33.3%	1		2.26s	522	117	0
MiMo-V2.5	5.4	2.5	66.7%	1		5.37s	492	121	418

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		1.67s	711	72	0
MiMo-V2.5	9.9	10.0	100.0%	0		1.80s	672	88	801

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Qwen3.5 Plus 2026-02-15	7.7	10.0	66.7%	0		2.71s	714	494	0
MiMo-V2.5	8.2	7.2	88.9%	1		20.25s	660	279	33,254

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		3.33s	8,211	222	0
MiMo-V2.5	10.0	10.0	100.0%	0		7.29s	8,220	303	2,424

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Qwen3.5 Plus 2026-02-15	3.0	10.0	0.0%	0		1.11s	210	11	0
MiMo-V2.5	3.0	10.0	0.0%	0		51.29s	210	22	15,484

Comparaison rapide

Changer la paire de comparaison

North Mini CodemediumDisponible gratuitementvsQwen3.5 Plus 2026-02-15none Gemini 3.5 FlashminimalvsMiMo-V2.5medium Qwen3.7 MaxnonevsMiMo-V2.5medium Gemini 3 Flash PreviewnonevsMiMo-V2.5medium Gemini 3.1 Flash Lite PreviewlowvsMiMo-V2.5medium Gemini 3.5 FlashnonevsMiMo-V2.5medium Gemini 3.1 Flash Lite PreviewnonevsMiMo-V2.5medium Gemini 3.1 Flash LitelowvsMiMo-V2.5medium Gemini 3.1 Flash LiteminimalvsQwen3.5 Plus 2026-02-15none Step 3.7 FlashhighvsMiMo-V2.5medium MiMo-V2.5mediumvsGLM 5.2none Qwen3.7 PlusnonevsMiMo-V2.5medium