GPT-5.5 vs Qwen3.5-35B-A3B (medium)

Model yang direkomendasikan GPT-5.5

It has the best score here (6.9), while costing about 1.5x less than Qwen3.5-35B-A3B (medium).

Perbandingan terperinci

Metrik	GPT-5.5 GPT-5.5 none Rilis: 2026-04-24	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Rilis: 2026-02-24

Metrik	GPT-5.5 GPT-5.5 none Rilis: 2026-04-24	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Rilis: 2026-02-24
Skor	6.9	6.2
Peringkat	#98	#133
Keandalan	10.0	10.0
Konsistensi	8.9	7.6
Tes benar
Tingkat lulus per percobaan	56.1%	66.7%
Tes tidak stabil	3	6
Total Run	66	66
Biaya per hasil	4.945	9.130
Total Biaya	$0.544	$0.837
Harga input	$5.000 / 1M	$0.140 / 1M
Harga output	$30.000 / 1M	$1.000 / 1M
Total token input	79,285	130,388
Token output	4,915	40,630
Token penalaran	0	786,040
Waktu respons (rata-rata)	2.36s	112.47s
Waktu respons (maks)	12.24s	950.25s
Waktu respons (total)	51.88s	2474.28s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

none

medium

Kategori:

Trik anti-AI	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
GPT-5.5	6.9	7.9	66.7%	1		1.31s	606	213	0
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		21.13s	672	798	42,652

Pemrograman	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
GPT-5.5	5.5	10.0	33.3%	0		1.35s	7,305	462	0
Qwen3.5-35B-A3B	5.9	9.3	33.3%	0		206.65s	4,106	23,844	111,462

Gabungan	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
GPT-5.5	6.5	10.0	50.0%	0		8.90s	56,092	3,244	0
Qwen3.5-35B-A3B	3.8	5.8	33.3%	1		512.79s	109,184	775	444,948

Parsing dan ekstraksi data	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
GPT-5.5	10.0	10.0	100.0%	0		1.18s	7,140	222	0
Qwen3.5-35B-A3B	7.3	5.9	83.3%	1		59.33s	6,061	235	19,493

Spesifik domain	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
GPT-5.5	2.9	7.2	11.1%	1		1.31s	723	52	0
Qwen3.5-35B-A3B	4.1	4.4	44.5%	2		88.34s	500	41	46,368

Kecerdasan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
GPT-5.5	10.0	10.0	100.0%	0		3.41s	477	124	0
Qwen3.5-35B-A3B	2.8	1.6	33.3%	1		30.30s	172	20	3,753

Kepatuhan instruksi	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
GPT-5.5	6.2	5.8	66.7%	1		1.15s	660	81	0
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		24.45s	699	97	17,361

Pemecahan teka-teki	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
GPT-5.5	7.7	10.0	66.7%	0		1.29s	642	252	0
Qwen3.5-35B-A3B	8.2	7.2	88.9%	1		33.13s	597	3,592	26,585

Pemanggilan alat	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
GPT-5.5	10.0	10.0	100.0%	0		3.90s	5,445	247	0
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		4.65s	8,193	309	1,365

Pengetahuan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
GPT-5.5	3.0	10.0	0.0%	0		5.01s	195	18	0
Qwen3.5-35B-A3B	3.0	10.0	0.0%	0		177.35s	204	10,919	72,053

Ganti Pasangan Perbandingan