AI BENCHY Compare

OpenAI: GPT-5.4 Nano vs Qwen: Qwen3.5-35B-A3B

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-11

Metrică	GPT-5.4 Nano GPT-5.4 Nano medium Lansare: 2026-03-17	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Lansare: 2026-02-24

Metrică	GPT-5.4 Nano GPT-5.4 Nano medium Lansare: 2026-03-17	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Lansare: 2026-02-24
Scor	7.6	7.4
Rang	#35	#40
Consistență	9.0	6.7
Teste corecte
Rată de trecere pe încercare	68.5%	79.6%
Teste instabile	2	7
Rulări totale	54	54
Cost per rezultat	0.747	3.976
Cost total	$0.083	$0.398
Preț de intrare	$0.200 / 1M	$0.163 / 1M
Preț de ieșire	$1.250 / 1M	$1.300 / 1M
Tokenuri de ieșire	2,946	10,137
Tokenuri de raționament	58,132	208,761
Timp de răspuns (mediu)	11.21s	44.51s
Timp de răspuns (maxim)	94.06s	106.00s
Timp de răspuns (total)	201.80s	801.21s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4 Nano	8.3	10.0	75.0%	0		4.52s	683	2,254
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		21.13s	798	42,652

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4 Nano	10.0	10.0	100.0%	0		13.41s	472	3,616
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		79.09s	4,273	33,078

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4 Nano	9.8	10.0	100.0%	0		24.13s	349	5,719
Qwen3.5-35B-A3B	4.7	1.6	66.7%	1		75.34s	775	12,485

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4 Nano	10.0	10.0	100.0%	0		2.54s	234	516
Qwen3.5-35B-A3B	7.3	5.9	83.3%	1		59.33s	235	19,493

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4 Nano	5.9	7.2	55.6%	1		38.18s	60	43,325
Qwen3.5-35B-A3B	4.1	4.4	44.5%	2		88.34s	41	46,368

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4 Nano	4.5	10.0	0.0%	0		4.15s	179	443
Qwen3.5-35B-A3B	2.8	1.6	33.3%	1		30.30s	20	3,753

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4 Nano	9.8	10.0	100.0%	0		1.88s	95	521
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		24.45s	97	17,361

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4 Nano	4.0	7.1	22.2%	1		3.65s	640	1,356
Qwen3.5-35B-A3B	6.4	4.4	77.8%	2		31.58s	3,589	32,206

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4 Nano	10.0	10.0	100.0%	0		7.71s	234	382
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		4.65s	309	1,365

Comparație rapidă

Schimbă perechea de comparație

Claude Sonnet 4.6nonevsQwen3.5-35B-A3Bmedium Claude Sonnet 4.6nonevsGPT-5.4 Nanomedium GPT-5.3 ChatnonevsQwen3.5-35B-A3Bmedium Gemini 3.1 Flash Lite PreviewnonevsGPT-5.4 Nanomedium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-35B-A3Bmedium GPT-5.2 ChatnonevsQwen3.5-35B-A3Bmedium Gemma 4 31BnoneDisponibil gratuitvsQwen3.5-35B-A3Bmedium Gemini 3.1 Flash Lite PreviewlowvsGPT-5.4 Nanomedium Gemini 3 Flash PreviewnonevsGPT-5.4 Nanomedium Gemma 4 31BnoneDisponibil gratuitvsGPT-5.4 Nanomedium Gemini 3.1 Flash Lite PreviewlowvsQwen3.5-35B-A3Bmedium Gemini 3 Flash PreviewnonevsQwen3.5-35B-A3Bmedium