AI BENCHY Compare

OpenAI: GPT-5.4 Mini vs Qwen: Qwen3 Coder Next

Rezumat

Comparație benchmark GPT-5.4 Mini vs Qwen3 Coder Next: GPT-5.4 Mini conduce la scorul mediu cu 5.3 vs 4.7. Qwen3 Coder Next are costul de benchmark mai mic, $0.008 vs $0.038. GPT-5.4 Mini este mai rapid cu 1.13s vs 8.58s, cu rate de reușită de 30.2% vs 28.6%.

Model recomandat: GPT-5.4 Mini - Are cel mai bun scor aici (5.3) și răspunde de aproximativ 7.6x mai rapid decât Qwen3 Coder Next.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-06-12

Metrică	GPT-5.4 Mini GPT-5.4 Mini none Lansare: 2026-03-17	Qwen3 Coder Next Qwen3 Coder Next medium Lansare: 2026-02-03

Metrică	GPT-5.4 Mini GPT-5.4 Mini none Lansare: 2026-03-17	Qwen3 Coder Next Qwen3 Coder Next medium Lansare: 2026-02-03
Scor	5.3	4.7
Rang	#131	#153
Fiabilitate	10.0	10.0
Consistență	8.8	8.9
Teste corecte
Rată de trecere pe încercare	30.2%	28.6%
Teste instabile	3	3
Rulări totale	63	63
Cost per rezultat	0.743	0.201
Cost total	$0.038	$0.008
Preț de intrare	$0.750 / 1M	$0.110 / 1M
Preț de ieșire	$4.500 / 1M	$0.800 / 1M
Total tokenuri de intrare	34,244	47,250
Tokenuri de ieșire	2,541	3,319
Tokenuri de raționament	0	0
Timp de răspuns (mediu)	1.13s	8.58s
Timp de răspuns (maxim)	2.52s	81.80s
Timp de răspuns (total)	23.82s	128.68s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#131 GPT-5.4 Mini

none

Cost: $0.010
Time: 11.7s
Tokens: 2,151 tok

#153 Qwen3 Coder Next

medium

Invalid SVG

Cost: $0.000
Time: 300.0s
Tokens: 0 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4 Mini	3.1	8.1	8.3%	1		929ms	606	654	0
Qwen3 Coder Next	3.5	8.1	16.7%	1		8.64s	645	1,252	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4 Mini	5.5	10.0	33.3%	0		913ms	7,305	401	0
Qwen3 Coder Next	3.7	7.2	22.2%	1		924ms	7,185	336	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4 Mini	3.0	10.0	0.0%	0		2.52s	11,019	298	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		4.28s	20,469	317	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4 Mini	10.0	10.0	100.0%	0		1.30s	7,140	222	0
Qwen3 Coder Next	6.5	10.0	50.0%	0		81.80s	7,758	246	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4 Mini	3.5	4.4	33.3%	2		937ms	723	88	0
Qwen3 Coder Next	5.3	10.0	33.3%	0		638ms	753	25	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4 Mini	4.8	10.0	0.0%	0		1.82s	477	174	0
Qwen3 Coder Next	6.3	3.4	66.7%	1		1.39s	498	142	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4 Mini	6.3	10.0	50.0%	0		728ms	660	101	0
Qwen3 Coder Next	6.3	10.0	50.0%	0		7.49s	684	63	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4 Mini	5.4	10.0	33.3%	0		836ms	642	305	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		1.25s	678	671	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4 Mini	3.0	10.0	0.0%	0		2.32s	5,477	255	0
Qwen3 Coder Next	10.0	10.0	100.0%	0		2.64s	8,364	255	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4 Mini	3.0	10.0	0.0%	0		1.33s	195	43	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		399ms	216	12	0

Comparație rapidă

Schimbă perechea de comparație