AI BENCHY Compare

DeepSeek: DeepSeek V4 Flash vs Qwen: Qwen3 Coder Next

Rezumat

Comparație benchmark DeepSeek V4 Flash vs Qwen3 Coder Next: DeepSeek V4 Flash conduce la scorul mediu cu 5.0 vs 4.6. DeepSeek V4 Flash are costul de benchmark mai mic, $0.008 vs $0.008. Qwen3 Coder Next este mai rapid cu 8.58s vs 26.75s, cu rate de reușită de 30.2% vs 28.6%.

Model recomandat: Qwen3 Coder Next - Scorul rămâne aproape de cel mai bun scor de aici (4.6 vs 5.0) și răspunde de aproximativ 3.1x mai rapid decât DeepSeek V4 Flash.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-06-04

Metrică	DeepSeek V4 Flash DeepSeek V4 Flash none Lansare: 2026-04-24	Qwen3 Coder Next Qwen3 Coder Next medium Lansare: 2026-02-03

Metrică	DeepSeek V4 Flash DeepSeek V4 Flash none Lansare: 2026-04-24	Qwen3 Coder Next Qwen3 Coder Next medium Lansare: 2026-02-03
Scor	5.0	4.6
Rang	#139	#150
Fiabilitate	10.0	10.0
Consistență	8.9	8.9
Teste corecte
Rată de trecere pe încercare	30.2%	28.6%
Teste instabile	3	3
Rulări totale	63	63
Cost per rezultat	0.203	0.201
Cost total	$0.008	$0.008
Preț de intrare	$0.099 / 1M	$0.110 / 1M
Preț de ieșire	$0.197 / 1M	$0.800 / 1M
Total tokenuri de intrare	50,127	47,250
Tokenuri de ieșire	13,710	3,319
Tokenuri de raționament	0	0
Timp de răspuns (mediu)	26.75s	8.58s
Timp de răspuns (maxim)	111.96s	81.80s
Timp de răspuns (total)	561.82s	128.68s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#139 DeepSeek V4 Flash

none

Cost: $0.004
Time: 157.6s
Tokens: 11,297 tok

#150 Qwen3 Coder Next

medium

Invalid SVG

Cost: $0.000
Time: 300.0s
Tokens: 0 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Flash	3.0	10.0	0.0%	0		20.18s	540	174	0
Qwen3 Coder Next	3.5	8.1	16.7%	1		8.64s	645	1,252	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Flash	4.2	7.4	11.1%	1		17.13s	7,279	9,717	0
Qwen3 Coder Next	3.7	7.2	22.2%	1		924ms	7,185	336	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Flash	4.5	2.1	66.7%	1		111.96s	24,398	2,664	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		4.28s	20,469	317	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Flash	10.0	10.0	100.0%	0		23.79s	7,290	195	0
Qwen3 Coder Next	6.5	10.0	50.0%	0		81.80s	7,758	246	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Flash	5.3	10.0	33.3%	0		19.73s	666	18	0
Qwen3 Coder Next	5.3	10.0	33.3%	0		638ms	753	25	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Flash	4.2	9.9	0.0%	0		23.74s	471	67	0
Qwen3 Coder Next	6.3	3.4	66.7%	1		1.39s	498	142	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Flash	6.5	10.0	50.0%	0		17.54s	627	321	0
Qwen3 Coder Next	6.3	10.0	50.0%	0		7.49s	684	63	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Flash	3.1	7.3	11.1%	1		23.72s	594	207	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		1.25s	678	671	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Flash	10.0	10.0	100.0%	0		77.93s	8,079	327	0
Qwen3 Coder Next	10.0	10.0	100.0%	0		2.64s	8,364	255	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
DeepSeek V4 Flash	3.0	10.0	0.0%	0		3.07s	183	20	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		399ms	216	12	0

Comparație rapidă

Schimbă perechea de comparație