AI BENCHY Compare

Google: Gemini 3.1 Flash Lite vs Google: Gemini 3.1 Pro Preview

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-05-08

Metrik	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite high Rilis: 2026-05-08	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Rilis: 2026-02-19

Metrik	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite high Rilis: 2026-05-08	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Rilis: 2026-02-19
Skor	7.5	9.6
Peringkat	#51	#2
Keandalan	9.8	10.0
Konsistensi	8.1	10.0
Tes benar
Tingkat lulus per percobaan	74.1%	94.7%
Tes tidak stabil	4	0
Total Run	54	57
Biaya per hasil	18.579	3.300
Total Biaya	$2.044	$0.594
Harga input	$0.250 / 1M	$2.000 / 1M
Harga output	$1.500 / 1M	$12.000 / 1M
Token output	1,984	1,944
Token penalaran	1,355,583	41,839
Waktu respons (rata-rata)	61.96s	15.15s
Waktu respons (maks)	149.23s	40.61s
Waktu respons (total)	1115.31s	181.78s

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Trik anti-AI	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Gemini 3.1 Flash Lite	9.4	10.0	100.0%	0		37.16s	100	130,598
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.90s	112	3,218

Pemrograman	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		137.63s	666	188,733
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		19.88s	405	4,201

Gabungan	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		149.23s	327	198,243
Gemini 3.1 Pro Preview	9.5	10.0	100.0%	0		40.61s	432	9,281

Parsing dan ekstraksi data	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		4.49s	279	7,351
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.72s	279	3,904

Spesifik domain	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Gemini 3.1 Flash Lite	3.6	7.2	22.2%	1		139.90s	18	566,210
Gemini 3.1 Pro Preview	7.7	10.0	66.7%	0		32.73s	18	12,424

Kecerdasan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Gemini 3.1 Flash Lite	5.0	2.1	66.7%	1		45.69s	95	64,644
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		11.77s	108	1,179

Kepatuhan instruksi	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Gemini 3.1 Flash Lite	7.3	5.8	83.3%	1		23.26s	52	3,549
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	72	2,236

Pemecahan teka-teki	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Gemini 3.1 Flash Lite	5.7	6.8	44.4%	1		50.83s	213	193,654
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.15s	232	3,117

Pemanggilan alat	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		6.44s	234	2,601
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	274	982

Pengetahuan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Gemini 3.1 Flash Lite	-	-	-	-	-	-	-	-
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		6.27s	12	1,297

Perbandingan Cepat

Ganti Pasangan Perbandingan

Gemini 3.1 Pro PreviewmediumvsGPT-5.5low Gemini 3.1 Pro PreviewmediumvsGPT-5.2 Chatnone Gemini 3.1 Pro PreviewmediumvsGPT-5.3 Chatnone DeepSeek V4 FlashhighvsGemini 3.1 Pro Previewmedium Gemini 3.1 Pro PreviewmediumvsQwen3.6 Max Previewnone Claude Sonnet 4.6nonevsGemini 3.1 Pro Previewmedium DeepSeek V4 ProhighvsGemini 3.1 Pro Previewmedium Gemini 3.1 Pro PreviewmediumvsGPT-5.5none Gemini 3.1 Pro PreviewmediumvsQwen3.5 Plus 2026-02-15none Gemini 3.1 Pro PreviewmediumvsGLM 5none Gemini 3.1 Pro PreviewmediumvsMiMo-V2-Omninone DeepSeek V4 PrononevsGemini 3.1 Pro Previewmedium