AI BENCHY Compare

OpenAI: gpt-oss-120b vs Qwen: Qwen3.5 Plus 2026-04-20

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-26

Metrică	gpt-oss-120b gpt-oss-120b none Lansare: 2025-08-05 Disponibil gratuit	Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 none Lansare: 2026-04-20

Metrică	gpt-oss-120b gpt-oss-120b none Lansare: 2025-08-05 Disponibil gratuit	Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 none Lansare: 2026-04-20
Scor	5.4	5.8
Rang	#119	#103
Fiabilitate	10.0	9.9
Consistență	9.1	8.5
Teste corecte
Rată de trecere pe încercare	38.6%	43.3%
Teste instabile	2	4
Rulări totale	57	60
Cost per rezultat	0.168	0.582
Cost total	$0.011	$0.041
Preț de intrare	$0.000 / 1M	$0.300 / 1M
Preț de ieșire	$0.000 / 1M	$1.800 / 1M
Tokenuri de ieșire	51,664	11,139
Tokenuri de raționament	0	0
Timp de răspuns (mediu)	21.61s	4.57s
Timp de răspuns (maxim)	113.71s	33.34s
Timp de răspuns (total)	345.79s	91.37s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
gpt-oss-120b	6.5	10.0	50.0%	0		32.84s	8,676	0
Qwen3.5 Plus 2026-04-20	4.8	10.0	25.0%	0		1.88s	557	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
gpt-oss-120b	4.3	1.1	66.7%	1		9.57s	3,232	0
Qwen3.5 Plus 2026-04-20	4.4	6.7	16.7%	1		2.08s	474	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0
Qwen3.5 Plus 2026-04-20	2.8	1.6	33.3%	1		13.32s	2,275	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
gpt-oss-120b	6.5	10.0	50.0%	0		7.12s	598	0
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		2.82s	243	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
gpt-oss-120b	3.0	10.0	0.0%	0		34.98s	29,483	0
Qwen3.5 Plus 2026-04-20	5.3	10.0	33.3%	0		4.43s	18	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
gpt-oss-120b	4.8	10.0	0.0%	0		10.79s	615	0
Qwen3.5 Plus 2026-04-20	4.8	10.0	0.0%	0		1.41s	119	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
gpt-oss-120b	9.8	10.0	100.0%	0		5.06s	1,940	0
Qwen3.5 Plus 2026-04-20	6.2	5.8	66.7%	1		1.17s	68	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
gpt-oss-120b	6.0	7.2	55.6%	1		8.21s	3,982	0
Qwen3.5 Plus 2026-04-20	6.7	7.9	55.6%	1		1.97s	583	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		4.42s	297	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
gpt-oss-120b	3.0	10.0	0.0%	0		47.29s	3,138	0
Qwen3.5 Plus 2026-04-20	3.0	10.0	0.0%	0		33.34s	6,505	0

Comparație rapidă

Schimbă perechea de comparație

MiniMax M2.5mediumDisponibil gratuitvsgpt-oss-120bnoneDisponibil gratuit Owl AlphamediumvsQwen3.5 Plus 2026-04-20none Mistral Small 4mediumvsgpt-oss-120bnoneDisponibil gratuit gpt-oss-120bnoneDisponibil gratuitvsElephant Alphamedium MiniMax M2.7mediumvsgpt-oss-120bnoneDisponibil gratuit CobuddymediumDisponibil gratuitvsQwen3.5 Plus 2026-04-20none gpt-oss-120bmediumDisponibil gratuitvsQwen3.5 Plus 2026-04-20none Nemotron 3 SupermediumDisponibil gratuitvsQwen3.5 Plus 2026-04-20none GPT-5 NanomediumvsQwen3.5 Plus 2026-04-20none CobuddymediumDisponibil gratuitvsgpt-oss-120bnoneDisponibil gratuit MiniMax M2.5mediumDisponibil gratuitvsQwen3.5 Plus 2026-04-20none gpt-oss-120bnoneDisponibil gratuitvsOwl Alphamedium