Gemini 3.1 Flash Lite (medium) vs Qwen3.5 Plus 2026-04-20 (medium)

Model yang direkomendasikan Gemini 3.1 Flash Lite (medium)

It has the best score here (7.3), while costing about 2.7x less than Qwen3.5 Plus 2026-04-20 (medium).

Perbandingan terperinci

Metrik	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite medium Rilis: 2026-05-08	Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 medium Rilis: 2026-04-20

Metrik	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite medium Rilis: 2026-05-08	Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 medium Rilis: 2026-04-20
Skor	7.3	7.2
Peringkat	#73	#78
Keandalan	10.0	9.6
Konsistensi	9.2	9.0
Tes benar
Tingkat lulus per percobaan	62.1%	63.6%
Tes tidak stabil	2	2
Total Run	66	66
Biaya per hasil	0.898	3.023
Total Biaya	$0.117	$0.317
Harga input	$0.250 / 1M	$0.300 / 1M
Harga output	$1.500 / 1M	$1.800 / 1M
Total token input	104,918	42,097
Token output	9,168	2,280
Token penalaran	51,130	166,613
Waktu respons (rata-rata)	4.27s	46.36s
Waktu respons (maks)	26.22s	189.38s
Waktu respons (total)	94.02s	973.57s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

medium

Kategori:

Trik anti-AI	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Gemini 3.1 Flash Lite	9.1	10.0	75.0%	0		2.39s	502	604	4,201
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		10.84s	672	215	7,748

Pemrograman	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Gemini 3.1 Flash Lite	5.5	10.0	33.3%	0		3.81s	8,134	459	8,978
Qwen3.5 Plus 2026-04-20	6.2	8.7	33.3%	0		125.25s	7,630	308	58,682

Gabungan	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Gemini 3.1 Flash Lite	7.2	9.1	50.0%	0		18.55s	80,983	7,241	20,231
Qwen3.5 Plus 2026-04-20	6.5	10.0	50.0%	0		92.41s	14,934	483	17,490

Parsing dan ekstraksi data	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		2.60s	7,362	279	2,845
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		38.32s	7,782	270	14,668

Spesifik domain	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Gemini 3.1 Flash Lite	2.9	7.2	11.1%	1		3.16s	643	15	5,165
Qwen3.5 Plus 2026-04-20	2.9	7.2	11.1%	1		53.10s	771	63	28,414

Kecerdasan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		2.60s	488	84	1,142
Qwen3.5 Plus 2026-04-20	4.9	9.6	0.0%	0		25.30s	516	125	4,792

Kepatuhan instruksi	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Gemini 3.1 Flash Lite	9.9	10.0	100.0%	0		2.59s	623	75	3,320
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		20.25s	699	103	7,689

Pemecahan teka-teki	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Gemini 3.1 Flash Lite	7.6	7.2	77.8%	1		1.95s	568	165	2,450
Qwen3.5 Plus 2026-04-20	8.2	7.2	88.9%	1		17.67s	696	338	9,800

Pemanggilan alat	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		4.55s	5,457	234	921
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		14.72s	8,193	348	2,164

Pengetahuan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		3.08s	158	12	1,877
Qwen3.5 Plus 2026-04-20	3.0	10.0	0.0%	0		92.57s	204	27	15,166

Ganti Pasangan Perbandingan