Navigare
AI BENCHY
Advertise here

AI BENCHY Compare

DeepSeek: DeepSeek V4 Flash vs Qwen: Qwen3.7 Max

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-06-04

Metrică DeepSeek V4 Flash DeepSeek V4 Flash high Lansare: 2026-04-24 Qwen3.7 Max Qwen3.7 Max none Lansare: 2026-05-22
Scor 7.7 7.7
Rang #31 #34
Fiabilitate 10.0 10.0
Consistență 8.5 10.0
Teste corecte
Rată de trecere pe încercare 74.6% 66.7%
Teste instabile 4 0
Rulări totale 63 63
Cost per rezultat 0.299 0.744
Cost total $0.029 $0.054
Preț de intrare $0.099 / 1M $1.250 / 1M
Preț de ieșire $0.197 / 1M $3.750 / 1M
Total tokenuri de intrare 39,745 37,107
Tokenuri de ieșire 10,310 1,994
Tokenuri de raționament 123,501 0
Timp de răspuns (mediu) 45.85s 1.30s
Timp de răspuns (maxim) 218.13s 3.92s
Timp de răspuns (total) 962.79s 27.21s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Flash 8.3 10.0 75.0% 0 28.51s 540 140 7,770
Qwen3.7 Max 6.5 10.0 50.0% 0 1.08s 696 242 0
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Flash 7.8 10.0 66.7% 0 50.60s 7,279 395 34,862
Qwen3.7 Max 5.5 10.0 33.3% 0 1.35s 7,911 582 0
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Flash 10.0 10.0 100.0% 0 76.57s 14,016 465 7,347
Qwen3.7 Max 3.0 10.0 0.0% 0 2.17s 9,549 171 0
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Flash 10.0 10.0 100.0% 0 28.03s 7,290 201 1,179
Qwen3.7 Max 10.0 10.0 100.0% 0 1.35s 7,794 243 0
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Flash 4.1 4.4 44.5% 2 100.31s 666 27 59,249
Qwen3.7 Max 7.7 10.0 66.7% 0 975ms 789 15 0
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Flash 6.1 3.1 66.7% 1 25.15s 471 79 632
Qwen3.7 Max 10.0 10.0 100.0% 0 1.04s 522 120 0
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Flash 10.0 10.0 100.0% 0 15.36s 627 63 1,622
Qwen3.7 Max 10.0 10.0 100.0% 0 943ms 711 72 0
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Flash 8.2 7.2 88.9% 1 26.11s 594 196 1,767
Qwen3.7 Max 10.0 10.0 100.0% 0 1.13s 714 314 0
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Flash 10.0 10.0 100.0% 0 74.73s 8,079 228 542
Qwen3.7 Max 10.0 10.0 100.0% 0 3.92s 8,211 222 0
Cultură generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
DeepSeek V4 Flash 3.0 10.0 0.0% 0 54.46s 183 8,516 8,531
Qwen3.7 Max 3.0 10.0 0.0% 0 856ms 210 13 0

Comparație rapidă

Schimbă perechea de comparație