#22

Gemini 3.1 Flash Lite

Google Rilis: 2026-05-08 Diuji pada: 2026-05-08 12:01 google/gemini-3.1-flash-lite::medium

(high) (medium) (low) (minimal) (none)

Ringkasan

Gemini 3.1 Flash Lite mendapat skor 8.2 di AI BENCHY dan berada di peringkat #22. Model ini memiliki reliabilitas 10.0, tingkat keberhasilan 75.9%, total biaya $0.056, dan waktu respons rata-rata 3.14s.

Yang membuat Gemini 3.1 Flash Lite unik: Model ini paling menonjol di Pemrograman, dengan peringkat #1, sementara Spesifik domain adalah area terlemahnya di #16. Model ini terasa cepat dibandingkan model serupa.

Catatan identitas

Google: Gemini 3.1 Flash Lite Preview adalah versi pratinjau dari Gemini 3.1 Flash Lite.

Skor

8.2

Konsistensi

9.1

Keandalan

10.0

Total biaya (harga saat ini)

$0.056

Total token output

32,369

Total token input

Harga input

$0.250 / 1M

Harga output

$1.500 / 1M

Tes benar

Tes Salah: 5

Tingkat lulus per percobaan: 75.9%

Tes tidak stabil

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

3.14s

Waktu respons (maks): 10.87s

Waktu respons (total): 56.54s

Jawaban salah: 4 Tidak mengikuti instruksi: 1

Showcase generasi

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#22 Gemini 3.1 Flash Lite

medium

Biaya: $0.003
Waktu: 5.3s
Token: 1,754 tok

Riwayat run

Diuji pada	Skor	Keandalan	Total Biaya	Bandingkan
2026-06-04 14:00 Tes baru ditambahkan	7.5	10.0	$0.071	Bandingkan
2026-05-22 00:27 Suite berubah	7.7	10.0	$0.065	Bandingkan
2026-05-08 12:01 Run awal	8.2	10.0	$0.056	Run saat ini

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Rincian Kategori

Kategori	Skor	Konsistensi
Trik anti-AI	9.1	10.0
Pemrograman	10.0	10.0
Gabungan	10.0	10.0
Parsing dan ekstraksi data	10.0	10.0
Spesifik domain	2.9	7.2
Kecerdasan umum	10.0	10.0
Kepatuhan instruksi	9.9	10.0
Pemecahan teka-teki	7.6	7.2
Pemanggilan alat	10.0	10.0

Gemini 3.1 Flash Lite

Hamster playing table tennis

#22 Gemini 3.1 Flash Lite

Grafik

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Rincian Kategori

Model yang Dibandingkan