AI BENCHY Compare

OpenAI: GPT-5 Mini vs Qwen: Qwen3.5-9B

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-03-12

Metrik	GPT-5 Mini GPT-5 Mini medium Rilis: 2025-08-07	Qwen3.5-9B Qwen3.5-9B none Rilis: 2026-03-02

Metrik	GPT-5 Mini GPT-5 Mini medium Rilis: 2025-08-07	Qwen3.5-9B Qwen3.5-9B none Rilis: 2026-03-02
Peringkat	#34	#60
Skor Rata-rata	6.0	3.4
Konsistensi	8.9	10.0
Biaya per hasil	1.457	0.111
Total Biaya	$0.117	$0.005
Tes benar
Tingkat lulus per percobaan	58.3%	25.0%
Tes tidak stabil	2	0
Total Run	48	48
Token output	5,826	2,939
Token penalaran	48,768	0
Waktu respons (rata-rata)	25.14s	1.06s
Waktu respons (maks)	88.15s	5.91s
Waktu respons (total)	402.29s	16.95s

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor Rata-rata vs Waktu respons (rata-rata)

Total token output

Skor Rata-rata vs Total token output

Rincian Kategori

Trik anti-AI	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
GPT-5 Mini	7.0	9.6	66.7%	0		16.45s	1,645	5,824
Qwen3.5-9B	10.0	9.9	0.0%	0		1.02s	576	0

Gabungan	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
GPT-5 Mini	10.0	10.0	100.0%	0		88.15s	754	11,520
Qwen3.5-9B	10.0	10.0	0.0%	0		5.91s	1,255	0

Parsing dan ekstraksi data	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
GPT-5 Mini	9.9	10.0	100.0%	0		12.58s	453	3,200
Qwen3.5-9B	9.9	10.0	100.0%	0		847ms	249	0

Spesifik domain	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
GPT-5 Mini	10.0	7.2	22.2%	1		44.63s	293	14,016
Qwen3.5-9B	10.0	10.0	0.0%	0		464ms	24	0

Kecerdasan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
GPT-5 Mini	4.0	10.0	0.0%	0		13.50s	349	1,856
Qwen3.5-9B	3.0	9.9	0.0%	0		552ms	99	0

Kepatuhan instruksi	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
GPT-5 Mini	7.5	6.6	83.3%	1		15.66s	318	4,992
Qwen3.5-9B	5.5	10.0	50.0%	0		514ms	75	0

Puzzle Solving	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
GPT-5 Mini	4.3	9.8	33.3%	0		14.09s	1,527	5,760
Qwen3.5-9B	10.0	9.9	0.0%	0		683ms	388	0

Pemanggilan alat	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
GPT-5 Mini	10.0	10.0	100.0%	0		18.64s	487	1,600
Qwen3.5-9B	10.0	10.0	100.0%	0		1.27s	273	0

Perbandingan Cepat

Ganti Pasangan Perbandingan

GPT-5 MinimediumvsGLM 5none GPT-5 MinimediumvsQwen3.5 Plus 2026-02-15none Qwen3.5-9BnonevsGLM 4.7 Flashmedium DeepSeek V3.2nonevsGPT-5 Minimedium Claude Sonnet 4.6nonevsGPT-5 Minimedium GPT-5 MinimediumvsQwen3.5-Flashnone Gemini 2.5 FlashnonevsGPT-5 Minimedium GPT-5 MinimediumvsQwen3.5-122B-A10Bnone Gemini 3.1 Flash Lite PreviewnonevsGPT-5 Minimedium Seed-2.0-LitenonevsGPT-5 Minimedium GPT-5 MinimediumvsQwen3.5-27Bnone Gemini 3 Flash PreviewnonevsGPT-5 Minimedium