OpenAI: GPT-5.4 vs Qwen: Qwen3.5-35B-A3B

Qwen3.5-35B-A3B conduce la scorul mediu cu 6.1 vs 5.8. Qwen3.5-35B-A3B are costul de benchmark mai mic, $0.106 vs $0.397. GPT-5.4 este mai rapid cu 2.07s vs 12.72s, cu rate de reușită de 34.9% vs 43.9%.

Model recomandatQwen3.5-35B-A3BAre cel mai bun scor aici (6.1) și costă de aproximativ 3.8x mai puțin decât GPT-5.4.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-07-18

Metrică	GPT-5.4 GPT-5.4 none Lansare: 2026-03-05	Qwen3.5-35B-A3B Qwen3.5-35B-A3B none Lansare: 2026-02-24

Metrică	GPT-5.4 GPT-5.4 none Lansare: 2026-03-05	Qwen3.5-35B-A3B Qwen3.5-35B-A3B none Lansare: 2026-02-24
Scor	5.8	6.1
Rang	#135	#123
Fiabilitate	10.0	10.0
Consistență	9.2	8.6
Teste corecte
Rată de trecere pe încercare	34.9%	43.9%
Teste instabile	2	4
Rulări totale	66	66
Cost per rezultat	5.663	1.578
Cost total	$0.397	$0.106
Preț de intrare	$2.500 / 1M	$0.140 / 1M
Preț de ieșire	$15.000 / 1M	$1.000 / 1M
Total tokenuri de intrare	108,632	134,521
Tokenuri de ieșire	8,321	86,614
Tokenuri de raționament	0	0
Timp de răspuns (mediu)	2.07s	12.72s
Timp de răspuns (maxim)	15.63s	209.15s
Timp de răspuns (total)	45.51s	279.90s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#135 GPT-5.4

none

Cost: $0.026
Timp: 18.1s
Tokenuri: 1,792 tok

#123 Qwen3.5-35B-A3B

none

Cost: $0.005
Timp: 28.4s
Tokenuri: 4,518 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Categorie:

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4	3.2	8.0	8.3%	1		1.21s	606	406	0
Qwen3.5-35B-A3B	3.4	7.9	16.7%	1		1.43s	696	574	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4	5.5	10.0	33.3%	0		1.62s	7,305	516	0
Qwen3.5-35B-A3B	5.5	10.0	33.3%	0		1.39s	7,808	571	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4	3.0	10.0	0.0%	0		9.26s	85,439	6,195	0
Qwen3.5-35B-A3B	3.8	5.8	33.3%	1		128.29s	107,066	84,104	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4	10.0	10.0	100.0%	0		1.04s	7,140	222	0
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		1.16s	7,794	243	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4	5.3	7.2	44.4%	1		1.07s	723	50	0
Qwen3.5-35B-A3B	7.7	10.0	66.7%	0		485ms	789	15	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4	4.4	9.9	0.0%	0		1.78s	477	184	0
Qwen3.5-35B-A3B	6.5	3.4	66.7%	1		1.19s	522	114	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4	6.5	10.0	50.0%	0		1.07s	660	81	0
Qwen3.5-35B-A3B	6.3	10.0	50.0%	0		809ms	711	63	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4	5.6	9.8	33.3%	0		1.44s	642	381	0
Qwen3.5-35B-A3B	3.7	7.4	22.2%	1		1.35s	714	655	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4	10.0	10.0	100.0%	0		2.75s	5,445	246	0
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		2.30s	8,211	264	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.4	3.0	10.0	0.0%	0		990ms	195	40	0
Qwen3.5-35B-A3B	3.0	10.0	0.0%	0		493ms	210	11	0

Comparație rapidă

Schimbă perechea de comparație

GPT-5 NanomediumvsQwen3.5-35B-A3Bnone Qwen3.5-35B-A3BnonevsInklinglow Qwen3.5-35B-A3BnonevsStep 3.5 Flashmedium gpt-oss-120bmediumvsQwen3.5-35B-A3Bnone Nemotron 3 SupermediumDisponibil gratuitvsGPT-5.4none Gemini 3.1 Flash LiteminimalvsQwen3.5-35B-A3Bnone North Mini CodemediumDisponibil gratuitvsGPT-5.4none GPT-5.6 LunalowvsQwen3.5-35B-A3Bnone KAT-Coder-Air V2.5highvsGPT-5.4none North Mini CodemediumDisponibil gratuitvsQwen3.5-35B-A3Bnone KAT-Coder-Air V2.5mediumvsGPT-5.4none Gemma 4 31BmediumDisponibil gratuitvsQwen3.5-35B-A3Bnone