AI BENCHY Compare

OpenAI: gpt-oss-120b vs Qwen: Qwen3.5-27B

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-29

Metrică	gpt-oss-120b gpt-oss-120b medium Lansare: 2025-08-05 Disponibil gratuit	Qwen3.5-27B Qwen3.5-27B none Lansare: 2026-02-24

Metrică	gpt-oss-120b gpt-oss-120b medium Lansare: 2025-08-05 Disponibil gratuit	Qwen3.5-27B Qwen3.5-27B none Lansare: 2026-02-24
Scor	5.9	5.8
Rang	#103	#112
Fiabilitate	10.0	10.0
Consistență	7.9	9.3
Teste corecte
Rată de trecere pe încercare	50.0%	40.0%
Teste instabile	5	2
Rulări totale	60	60
Cost per rezultat	0.151	0.241
Cost total	$0.013	$0.017
Preț de intrare	$0.039 / 1M	$0.195 / 1M
Preț de ieșire	$0.180 / 1M	$1.560 / 1M
Tokenuri de ieșire	17,495	3,585
Tokenuri de raționament	46,878	0
Timp de răspuns (mediu)	22.41s	1.69s
Timp de răspuns (maxim)	68.16s	9.39s
Timp de răspuns (total)	291.35s	33.82s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
gpt-oss-120b	6.7	9.9	50.0%	0		10.21s	3,518	2,177
Qwen3.5-27B	4.8	10.0	25.0%	0		788ms	267	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
gpt-oss-120b	3.9	5.6	33.3%	1		47.24s	847	8,618
Qwen3.5-27B	7.3	10.0	50.0%	0		1.98s	408	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
gpt-oss-120b	10.0	10.0	100.0%	0		31.18s	694	5,072
Qwen3.5-27B	2.8	1.6	33.3%	1		9.39s	1,461	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
gpt-oss-120b	6.4	5.9	66.7%	1		1.98s	241	1,114
Qwen3.5-27B	10.0	10.0	100.0%	0		1.43s	243	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
gpt-oss-120b	2.9	4.4	22.2%	2		50.92s	6,784	20,606
Qwen3.5-27B	3.0	10.0	0.0%	0		540ms	15	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
gpt-oss-120b	4.3	10.0	0.0%	0		7.90s	107	387
Qwen3.5-27B	5.0	10.0	0.0%	0		2.51s	126	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
gpt-oss-120b	9.9	10.0	100.0%	0		7.63s	126	1,799
Qwen3.5-27B	6.3	10.0	50.0%	0		1.03s	69	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
gpt-oss-120b	5.3	7.2	44.4%	1		21.71s	1,790	2,264
Qwen3.5-27B	6.7	7.9	55.6%	1		1.38s	683	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
gpt-oss-120b	9.8	10.0	100.0%	0		6.91s	287	1,083
Qwen3.5-27B	10.0	10.0	100.0%	0		3.54s	303	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
gpt-oss-120b	3.0	10.0	0.0%	0		26.51s	3,101	3,758
Qwen3.5-27B	3.0	10.0	0.0%	0		599ms	10	0

Comparație rapidă

Schimbă perechea de comparație

gpt-oss-120bmediumDisponibil gratuitvsQwen3.5-Flashnone gpt-oss-120bmediumDisponibil gratuitvsGLM 5V Turbonone CobuddymediumvsQwen3.5-27Bnone Seed-2.0-Litenonevsgpt-oss-120bmediumDisponibil gratuit gpt-oss-120bmediumDisponibil gratuitvsGLM 5.1none gpt-oss-120bmediumDisponibil gratuitvsQwen3.5 Plus 2026-04-20none Owl AlphamediumvsQwen3.5-27Bnone gpt-oss-120bmediumDisponibil gratuitvsQwen3.5-35B-A3Bnone gpt-oss-120bmediumDisponibil gratuitvsQwen3.6 27Bnone Nemotron 3 SupermediumDisponibil gratuitvsQwen3.5-27Bnone gpt-oss-120bmediumDisponibil gratuitvsMiMo-V2-Pronone gpt-oss-120bmediumDisponibil gratuitvsMiMo-V2-Omninone