Navigation
AI BENCHY
Advertise here

AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Qwen: Qwen3.5-9B

Résumé

Comparaison benchmark DeepSeek V3.2 vs Qwen3.5-9B : DeepSeek V3.2 mène au score moyen avec 5.3 vs 3.8. DeepSeek V3.2 a le coût de benchmark le plus bas avec $0.017 vs $0.036. DeepSeek V3.2 est plus rapide avec 13.83s vs 82.24s, avec des taux de réussite de 39.7% vs 27.0%.

Modèle recommandé: DeepSeek V3.2 - Il obtient le meilleur score ici (5.3) tout en coûtant environ 2.1x moins que Qwen3.5-9B.

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-18

Métrique DeepSeek V3.2 DeepSeek V3.2 none Sortie: 2025-12-01 Qwen3.5-9B Qwen3.5-9B medium Sortie: 2026-03-02
Score 5.3 3.8
Rang #126 #165
Fiabilité 10.0 6.7
Cohérence 7.6 8.0
Tests corrects
Taux de réussite par tentative 39.7% 27.0%
Tests instables 6 5
Exécutions totales 63 63
Coût par résultat 0.306 1.187
Coût total $0.017 $0.036
Prix d'entrée $0.229 / 1M $0.100 / 1M
Prix de sortie $0.344 / 1M $0.150 / 1M
Total des jetons d'entrée 55,997 17,070
Jetons de sortie 11,165 29,045
Jetons de raisonnement 0 209,516
Temps de réponse (moy.) 13.83s 82.24s
Temps de réponse (max) 115.89s 226.38s
Temps de réponse (total) 290.43s 1315.88s

Génération showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#126 DeepSeek V3.2

none
Coût
$0.002
Temps
7.0s
Tokens
1,046 tok

#165 Qwen3.5-9B

medium
Coût
$0.001
Temps
35.9s
Tokens
3,030 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
DeepSeek V3.2 3.2 8.0 8.3% 1 9.35s 494 1,073 0
Qwen3.5-9B 5.1 5.8 50.0% 2 34.44s 369 2,621 12,411
Programmation Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
DeepSeek V3.2 3.1 6.9 11.1% 1 14.54s 7,279 4,528 0
Qwen3.5-9B 2.9 10.0 0.0% 0 100.88s 2,396 7,890 41,129
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
DeepSeek V3.2 6.5 10.0 0.0% 0 115.89s 29,843 2,887 0
Qwen3.5-9B 3.0 10.0 0.0% 0 0ms 0 0 0
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
DeepSeek V3.2 6.3 5.8 66.7% 1 9.42s 7,890 1,710 0
Qwen3.5-9B 3.6 5.6 33.3% 1 87.31s 4,722 1,383 32,113
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
DeepSeek V3.2 2.9 7.2 11.1% 1 4.17s 624 21 0
Qwen3.5-9B 3.6 7.2 22.2% 1 137.75s 295 11,549 48,475
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
DeepSeek V3.2 4.7 1.6 66.7% 1 9.32s 314 43 0
Qwen3.5-9B 2.8 1.6 33.3% 1 226.38s 180 0 30,695
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
DeepSeek V3.2 10.0 10.0 100.0% 0 1.52s 627 66 0
Qwen3.5-9B 6.5 10.0 50.0% 0 5.75s 381 491 1,824
Résolution d'énigmes Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
DeepSeek V3.2 7.6 7.2 77.8% 1 6.91s 424 298 0
Qwen3.5-9B 3.0 10.0 0.0% 0 32.27s 376 1,593 12,026
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
DeepSeek V3.2 10.0 10.0 100.0% 0 11.85s 8,319 522 0
Qwen3.5-9B 10.0 10.0 100.0% 0 4.31s 8,283 444 1,149
Culture générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
DeepSeek V3.2 3.0 10.0 0.0% 0 17.23s 183 17 0
Qwen3.5-9B 3.0 10.0 0.0% 0 177.02s 68 3,074 29,694

Comparaison rapide

Changer la paire de comparaison