AI BENCHY Compare

DeepSeek: DeepSeek V4 Flash vs Qwen: Qwen3.5-122B-A10B

Rezumat

Comparație benchmark DeepSeek V4 Flash vs Qwen3.5-122B-A10B: Scorul mediu este practic egal la 7.7 vs 7.8. DeepSeek V4 Flash are costul de benchmark mai mic, $0.029 vs $0.588. Qwen3.5-122B-A10B este mai rapid cu 42.49s vs 45.85s, cu rate de reușită de 74.6% vs 73.0%.

Model recomandat: DeepSeek V4 Flash - Are cel mai bun scor aici (7.7) și costă de aproximativ 20.6x mai puțin decât Qwen3.5-122B-A10B.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-06-10

Metrică	DeepSeek V4 Flash DeepSeek V4 Flash high Lansare: 2026-04-24	Qwen3.5-122B-A10B Qwen3.5-122B-A10B medium Lansare: 2026-02-24

Metrică	DeepSeek V4 Flash DeepSeek V4 Flash high Lansare: 2026-04-24	Qwen3.5-122B-A10B Qwen3.5-122B-A10B medium Lansare: 2026-02-24
Scor	7.7	7.8
Rang	#32	#30
Fiabilitate	10.0	10.0
Consistență	8.5	8.8
Teste corecte
Rată de trecere pe încercare	74.6%	73.0%
Teste instabile	4	3
Rulări totale	63	63
Cost per rezultat	0.299	5.235
Cost total	$0.029	$0.588
Preț de intrare	$0.099 / 1M	$0.260 / 1M
Preț de ieșire	$0.197 / 1M	$2.080 / 1M
Total tokenuri de intrare	39,745	41,832
Tokenuri de ieșire	10,310	26,187
Tokenuri de raționament	123,501	251,028
Timp de răspuns (mediu)	45.85s	42.49s
Timp de răspuns (maxim)	218.13s	168.16s
Timp de răspuns (total)	962.79s	892.30s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#32 DeepSeek V4 Flash

high

Cost: $0.003
Time: 93.1s
Tokens: 7,926 tok

#30 Qwen3.5-122B-A10B

medium

Cost: $0.019
Time: 48.7s
Tokens: 6,034 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Flash	8.3	10.0	75.0%	0		28.51s	540	140	7,770
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		9.75s	672	269	16,835

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Flash	7.8	10.0	66.7%	0		50.60s	7,279	395	34,862
Qwen3.5-122B-A10B	6.0	7.2	55.6%	1		114.48s	7,630	8,057	82,578

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Flash	10.0	10.0	100.0%	0		76.57s	14,016	465	7,347
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		107.79s	14,947	483	11,337

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Flash	10.0	10.0	100.0%	0		28.03s	7,290	201	1,179
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		23.41s	7,782	270	16,558

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Flash	4.1	4.4	44.5%	2		100.31s	666	27	59,249
Qwen3.5-122B-A10B	2.9	7.2	11.1%	1		63.40s	771	15,537	64,889

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Flash	6.1	3.1	66.7%	1		25.15s	471	79	632
Qwen3.5-122B-A10B	3.4	2.2	33.3%	1		34.11s	344	66	7,592

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Flash	10.0	10.0	100.0%	0		15.36s	627	63	1,622
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		9.88s	593	77	7,372

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Flash	8.2	7.2	88.9%	1		26.11s	594	196	1,767
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		17.89s	696	284	27,575

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Flash	10.0	10.0	100.0%	0		74.73s	8,079	228	542
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		4.60s	8,193	322	1,226

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Flash	3.0	10.0	0.0%	0		54.46s	183	8,516	8,531
Qwen3.5-122B-A10B	3.0	10.0	0.0%	0		52.87s	204	822	15,066

Comparație rapidă

Schimbă perechea de comparație