Navigare
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

DeepSeek: DeepSeek V4 Flash vs Qwen: Qwen3.5 Plus 2026-04-20

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-27

Metrică DeepSeek V4 Flash DeepSeek V4 Flash high Lansare: 2026-04-24 Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 medium Lansare: 2026-04-20
Scor 7.8 8.1
Rang #41 #32
Fiabilitate 10.0 9.7
Consistență 7.8 9.0
Teste corecte
Rată de trecere pe încercare 79.6% 77.8%
Teste instabile 5 2
Rulări totale 54 54
Cost per rezultat 0.277 2.065
Cost total $0.031 $0.269
Preț de intrare $0.140 / 1M $0.400 / 1M
Preț de ieșire $0.280 / 1M $2.400 / 1M
Tokenuri de ieșire 1,765 2,179
Tokenuri de raționament 90,299 103,832
Timp de răspuns (mediu) 45.41s 32.81s
Timp de răspuns (maxim) 218.13s 92.41s
Timp de răspuns (total) 817.30s 590.65s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Flash 8.3 10.0 75.0% 0 28.51s 140 7,770
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 10.84s 215 7,748
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Flash 10.0 10.0 100.0% 0 62.48s 369 9,361
Qwen3.5 Plus 2026-04-20 7.6 10.0 100.0% 0 85.72s 248 11,081
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Flash 10.0 10.0 100.0% 0 76.57s 465 7,347
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 92.41s 483 17,490
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Flash 10.0 10.0 100.0% 0 28.03s 201 1,179
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 38.32s 270 14,668
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Flash 4.1 4.4 44.5% 2 100.31s 27 59,249
Qwen3.5 Plus 2026-04-20 2.9 7.2 11.1% 1 53.10s 63 28,414
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Flash 6.1 3.1 66.7% 1 25.15s 79 632
Qwen3.5 Plus 2026-04-20 4.9 9.6 0.0% 0 25.30s 125 4,792
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Flash 10.0 10.0 100.0% 0 15.36s 63 1,622
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 20.25s 103 7,689
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Flash 6.4 4.5 77.8% 2 25.53s 193 2,597
Qwen3.5 Plus 2026-04-20 8.2 7.2 88.9% 1 17.58s 324 9,786
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Flash 10.0 10.0 100.0% 0 74.73s 228 542
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 14.72s 348 2,164

Comparație rapidă

Schimbă perechea de comparație