Navigation
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.5-9B vs Z.ai: GLM 4.7 Flash

Résumé

Comparaison benchmark Qwen3.5-9B vs GLM 4.7 Flash : Qwen3.5-9B mène au score moyen avec 4.6 vs 4.4. Qwen3.5-9B a le coût de benchmark le plus bas avec $0.006 vs $0.054. Qwen3.5-9B est plus rapide avec 1.89s vs 35.10s, avec des taux de réussite de 20.6% vs 33.3%.

Modèle recommandé: Qwen3.5-9B - Il obtient le meilleur score ici (4.6) tout en coûtant environ 9.9x moins que GLM 4.7 Flash.

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-10

Métrique Qwen3.5-9B Qwen3.5-9B none Sortie: 2026-03-02 GLM 4.7 Flash GLM 4.7 Flash medium Sortie: 2026-01-19
Score 4.6 4.4
Rang #155 #159
Fiabilité 10.0 6.7
Cohérence 9.7 6.8
Tests corrects
Taux de réussite par tentative 20.6% 33.3%
Tests instables 1 8
Exécutions totales 63 63
Coût par résultat 0.123 1.337
Coût total $0.006 $0.054
Prix d'entrée $0.100 / 1M $0.060 / 1M
Prix de sortie $0.150 / 1M $0.400 / 1M
Total des jetons d'entrée 48,041 37,206
Jetons de sortie 3,952 43,754
Jetons de raisonnement 0 89,079
Temps de réponse (moy.) 1.89s 35.10s
Temps de réponse (max) 6.03s 174.55s
Temps de réponse (total) 39.68s 456.24s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#155 Qwen3.5-9B

none
Invalid SVG
Cost
$0.000
Time
300.0s
Tokens
0 tok

#159 GLM 4.7 Flash

medium
Invalid SVG
Cost
$0.000
Time
186.2s
Tokens
12,112 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Qwen3.5-9B 3.1 9.9 0.0% 0 1.71s 696 582 0
GLM 4.7 Flash 4.7 5.9 41.7% 2 14.95s 555 1,122 6,110
Programmation Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Qwen3.5-9B 3.9 7.8 11.1% 1 5.60s 7,913 1,042 0
GLM 4.7 Flash 3.2 7.4 11.1% 1 55.33s 3,106 4,981 22,387
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Qwen3.5-9B 3.0 10.0 0.0% 0 5.91s 20,397 1,255 0
GLM 4.7 Flash 2.8 2.1 33.3% 1 65.57s 17,185 2,585 20,648
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Qwen3.5-9B 10.0 10.0 100.0% 0 847ms 7,788 249 0
GLM 4.7 Flash 6.3 10.0 50.0% 0 1.51s 7,107 584 2,755
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Qwen3.5-9B 3.0 10.0 0.0% 0 464ms 789 24 0
GLM 4.7 Flash 3.5 4.4 33.3% 2 174.55s 643 33,000 25,394
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Qwen3.5-9B 4.4 9.9 0.0% 0 552ms 522 99 0
GLM 4.7 Flash 3.6 9.7 0.0% 0 18.14s 318 18 2,138
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Qwen3.5-9B 6.5 10.0 50.0% 0 514ms 711 75 0
GLM 4.7 Flash 6.2 5.8 66.7% 1 2.97s 636 388 2,181
Résolution d'énigmes Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Qwen3.5-9B 3.2 10.0 0.0% 0 621ms 714 347 0
GLM 4.7 Flash 2.9 7.2 11.1% 1 12.93s 521 781 5,255
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Qwen3.5-9B 10.0 10.0 100.0% 0 1.27s 8,301 273 0
GLM 4.7 Flash 10.0 10.0 100.0% 0 15.95s 6,949 224 1,014
Culture générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Qwen3.5-9B 3.0 10.0 0.0% 0 2.32s 210 6 0
GLM 4.7 Flash 3.0 10.0 0.0% 0 11.13s 186 71 1,197

Comparaison rapide

Changer la paire de comparaison