Comparer Graphiques

Langue:

❤️ Made by XCS

AI BENCHY Compare

Qwen: Qwen3.5 Plus 2026-02-15 vs Xiaomi: MiMo-V2-Flash

Nom du modèle:

Benchmarks générés à partir des suites de tests AI BENCHY le : 2026-02-27 15:16

Résumé

Métrique	Qwen: Qwen3.5 Plus 2026-02-15 medium Sortie: Date de sortie inconnue	Xiaomi: MiMo-V2-Flash none Sortie: Date de sortie inconnue
Rang	#4	#37
Score	8.64	3.07
Cohérence	10.00	7.66
Coût par résultat	1.955	0.690
Coût total	$0.235	$0.021
Tests corrects
Tests incorrects	2	11
Taux de réussite par tentative	85.7%	31.0%
Tests instables	0	4
Jetons de sortie	1,258	67,133
Jetons de raisonnement	93,374	0

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Jetons de sortie	Jetons de raisonnement
Qwen: Qwen3.5 Plus 2026-02-15	10.00	10.00	100.0%	0		186	5,926
Xiaomi: MiMo-V2-Flash	1.00	7.33	11.1%	1		859	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Jetons de sortie	Jetons de raisonnement
Qwen: Qwen3.5 Plus 2026-02-15	10.00	10.00	100.0%	0		283	14,892
Xiaomi: MiMo-V2-Flash	1.00	5.81	16.7%	1		161	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Jetons de sortie	Jetons de raisonnement
Qwen: Qwen3.5 Plus 2026-02-15	4.00	10.00	33.3%	0		56	39,882
Xiaomi: MiMo-V2-Flash	4.00	7.21	44.4%	1		24	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Jetons de sortie	Jetons de raisonnement
Qwen: Qwen3.5 Plus 2026-02-15	9.50	9.99	100.0%	0		102	9,257
Xiaomi: MiMo-V2-Flash	5.00	9.99	50.0%	0		63	0

Puzzle Solving	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Jetons de sortie	Jetons de raisonnement
Qwen: Qwen3.5 Plus 2026-02-15	10.00	10.00	100.0%	0		322	22,508
Xiaomi: MiMo-V2-Flash	2.00	7.36	11.1%	1		65,754	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Jetons de sortie	Jetons de raisonnement
Qwen: Qwen3.5 Plus 2026-02-15	10.00	10.00	100.0%	0		309	909
Xiaomi: MiMo-V2-Flash	10.00	10.00	100.0%	0		272	0

Changer la paire de comparaison

Comparer Qwen: Qwen3.5 Plus 2026-02-15 à...

Comparer Xiaomi: MiMo-V2-Flash à...