Navigare
AI BENCHY
Advertise here

AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Qwen: Qwen3.5-9B

Rezumat

Comparație benchmark DeepSeek V3.2 vs Qwen3.5-9B: DeepSeek V3.2 conduce la scorul mediu cu 5.3 vs 3.8. DeepSeek V3.2 are costul de benchmark mai mic, $0.017 vs $0.036. DeepSeek V3.2 este mai rapid cu 13.83s vs 82.24s, cu rate de reușită de 39.7% vs 27.0%.

Model recomandat: DeepSeek V3.2 - Are cel mai bun scor aici (5.3) și costă de aproximativ 2.1x mai puțin decât Qwen3.5-9B.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-06-18

Metrică DeepSeek V3.2 DeepSeek V3.2 none Lansare: 2025-12-01 Qwen3.5-9B Qwen3.5-9B medium Lansare: 2026-03-02
Scor 5.3 3.8
Rang #126 #165
Fiabilitate 10.0 6.7
Consistență 7.6 8.0
Teste corecte
Rată de trecere pe încercare 39.7% 27.0%
Teste instabile 6 5
Rulări totale 63 63
Cost per rezultat 0.306 1.187
Cost total $0.017 $0.036
Preț de intrare $0.229 / 1M $0.100 / 1M
Preț de ieșire $0.344 / 1M $0.150 / 1M
Total tokenuri de intrare 55,997 17,070
Tokenuri de ieșire 11,165 29,045
Tokenuri de raționament 0 209,516
Timp de răspuns (mediu) 13.83s 82.24s
Timp de răspuns (maxim) 115.89s 226.38s
Timp de răspuns (total) 290.43s 1315.88s

Prezentare generare

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#126 DeepSeek V3.2

none
Cost
$0.002
Timp
7.0s
Tokenuri
1,046 tok

#165 Qwen3.5-9B

medium
Cost
$0.001
Timp
35.9s
Tokenuri
3,030 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
DeepSeek V3.2 3.2 8.0 8.3% 1 9.35s 494 1,073 0
Qwen3.5-9B 5.1 5.8 50.0% 2 34.44s 369 2,621 12,411
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
DeepSeek V3.2 3.1 6.9 11.1% 1 14.54s 7,279 4,528 0
Qwen3.5-9B 2.9 10.0 0.0% 0 100.88s 2,396 7,890 41,129
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
DeepSeek V3.2 6.5 10.0 0.0% 0 115.89s 29,843 2,887 0
Qwen3.5-9B 3.0 10.0 0.0% 0 0ms 0 0 0
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
DeepSeek V3.2 6.3 5.8 66.7% 1 9.42s 7,890 1,710 0
Qwen3.5-9B 3.6 5.6 33.3% 1 87.31s 4,722 1,383 32,113
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
DeepSeek V3.2 2.9 7.2 11.1% 1 4.17s 624 21 0
Qwen3.5-9B 3.6 7.2 22.2% 1 137.75s 295 11,549 48,475
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
DeepSeek V3.2 4.7 1.6 66.7% 1 9.32s 314 43 0
Qwen3.5-9B 2.8 1.6 33.3% 1 226.38s 180 0 30,695
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
DeepSeek V3.2 10.0 10.0 100.0% 0 1.52s 627 66 0
Qwen3.5-9B 6.5 10.0 50.0% 0 5.75s 381 491 1,824
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
DeepSeek V3.2 7.6 7.2 77.8% 1 6.91s 424 298 0
Qwen3.5-9B 3.0 10.0 0.0% 0 32.27s 376 1,593 12,026
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
DeepSeek V3.2 10.0 10.0 100.0% 0 11.85s 8,319 522 0
Qwen3.5-9B 10.0 10.0 100.0% 0 4.31s 8,283 444 1,149
Cultură generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
DeepSeek V3.2 3.0 10.0 0.0% 0 17.23s 183 17 0
Qwen3.5-9B 3.0 10.0 0.0% 0 177.02s 68 3,074 29,694

Comparație rapidă

Schimbă perechea de comparație