AI BENCHY Compare

OpenAI: gpt-oss-120b vs Qwen: Qwen3 Coder Next

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-16

Metrică	gpt-oss-120b gpt-oss-120b medium Lansare: 2025-08-05 Disponibil gratuit	Qwen3 Coder Next Qwen3 Coder Next none Lansare: 2026-02-03

Metrică	gpt-oss-120b gpt-oss-120b medium Lansare: 2025-08-05 Disponibil gratuit	Qwen3 Coder Next Qwen3 Coder Next none Lansare: 2026-02-03
Scor	5.8	5.1
Rang	#67	#85
Consistență	7.2	9.7
Teste corecte
Rată de trecere pe încercare	51.9%	25.9%
Teste instabile	6	1
Rulări totale	54	54
Cost per rezultat	0.144	0.188
Cost total	$0.011	$0.008
Preț de intrare	$0.039 / 1M	$0.150 / 1M
Preț de ieșire	$0.190 / 1M	$0.800 / 1M
Tokenuri de ieșire	13,493	3,617
Tokenuri de raționament	36,879	0
Timp de răspuns (mediu)	16.08s	10.18s
Timp de răspuns (maxim)	50.92s	45.14s
Timp de răspuns (total)	176.88s	122.13s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
gpt-oss-120b	6.7	9.9	50.0%	0		10.21s	3,518	2,177
Qwen3 Coder Next	3.6	10.0	0.0%	0		3.31s	1,321	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
gpt-oss-120b	4.3	1.1	66.7%	1		26.33s	228	2,549
Qwen3 Coder Next	7.3	3.7	66.7%	1		3.14s	585	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
gpt-oss-120b	10.0	10.0	100.0%	0		31.18s	694	5,072
Qwen3 Coder Next	3.0	10.0	0.0%	0		45.14s	317	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
gpt-oss-120b	6.4	5.9	66.7%	1		1.98s	241	1,114
Qwen3 Coder Next	6.5	10.0	50.0%	0		1.32s	246	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
gpt-oss-120b	2.9	4.4	22.2%	2		50.92s	6,784	20,606
Qwen3 Coder Next	5.3	10.0	33.3%	0		962ms	26	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
gpt-oss-120b	4.3	10.0	0.0%	0		7.90s	107	387
Qwen3 Coder Next	10.0	10.0	100.0%	0		1.34s	152	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
gpt-oss-120b	9.9	10.0	100.0%	0		7.63s	126	1,799
Qwen3 Coder Next	4.8	10.0	0.0%	0		7.71s	63	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
gpt-oss-120b	3.2	4.7	22.2%	2		11.80s	1,508	2,092
Qwen3 Coder Next	3.2	10.0	0.0%	0		22.86s	652	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
gpt-oss-120b	9.8	10.0	100.0%	0		6.91s	287	1,083
Qwen3 Coder Next	10.0	10.0	100.0%	0		2.47s	255	0

Comparație rapidă

Schimbă perechea de comparație

gpt-oss-120bmediumDisponibil gratuitvsQwen3.5-27Bnone ElephantmediumvsQwen3 Coder Nextnone gpt-oss-120bmediumDisponibil gratuitvsQwen3.5-122B-A10Bnone MiniMax M2.7mediumvsQwen3 Coder Nextnone gpt-oss-120bmediumDisponibil gratuitvsMiMo-V2-Pronone gpt-oss-120bmediumDisponibil gratuitvsGLM 4.7 Flashnone gpt-oss-120bmediumDisponibil gratuitvsGLM 5.1none DeepSeek V3.2nonevsgpt-oss-120bmediumDisponibil gratuit gpt-oss-120bmediumDisponibil gratuitvsQwen3.5-35B-A3Bnone Kimi K2.5nonevsgpt-oss-120bmediumDisponibil gratuit Gemini 2.5 Flashnonevsgpt-oss-120bmediumDisponibil gratuit Seed-2.0-Litenonevsgpt-oss-120bmediumDisponibil gratuit