#13

Gemini 3.1 Flash Lite Preview

Google Rilis: 2026-03-03 Diuji pada: 2026-05-06 14:01 google/gemini-3.1-flash-lite-preview::high

(high) (medium) (low) (none)

Ringkasan

Gemini 3.1 Flash Lite Preview mendapat skor 8.6 di AI BENCHY dan berada di peringkat #13. Model ini memiliki reliabilitas T/A, tingkat keberhasilan 81.3%, total biaya $2.310, dan waktu respons rata-rata 68.83s.

Yang membuat Gemini 3.1 Flash Lite Preview unik: Model ini memakai token reasoning yang sangat tinggi, yang bisa menjelaskan run yang lebih lambat atau lebih mahal.

Model diarsipkan: model ini tidak lagi diperbarui atau diuji pada pengujian baru.

Catatan identitas

Gemini 3.1 Flash Lite Preview adalah versi pratinjau dari Google: Gemini 3.1 Flash Lite.

Skor

8.6

Konsistensi

10.0

Keandalan

T/A

Total biaya (harga saat ini)

$2.310

Total token output

1,534,593

Total token input

Harga input

$0.250 / 1M

Harga output

$1.500 / 1M

Tes benar

Tes Salah: 3

Tingkat lulus per percobaan: 81.3%

Tes tidak stabil

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

68.83s

Waktu respons (maks): 280.52s

Waktu respons (total): 1101.32s

Jawaban salah: 3

Showcase generasi

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#13 Gemini 3.1 Flash Lite Preview

high

Biaya: $0.096
Waktu: 133.9s
Token: 63,687 tok

Riwayat run

Diuji pada	Skor	Keandalan	Total Biaya	Bandingkan
2026-05-06 14:01 Uji ulang	8.6	T/A	$2.310	Bandingkan
2026-05-06 14:01 Uji ulang	8.6	T/A	$2.310	Run saat ini
2026-05-06 14:01 Suite berubah	8.6	T/A	$2.310	Bandingkan
2026-04-10 23:27 Run pertama yang tercatat	8.4	T/A	$2.310	Bandingkan

Perbandingan run

Run	Skor	Konsistensi	Keandalan	Tes benar	Total token output	Total Biaya	Waktu respons (rata-rata)
2026-05-06 14:01 · Uji ulang	8.6	10.0	T/A	13/16	1,534,593	$2.310	68.83s
2026-05-06 14:01 · Suite berubah	8.6	10.0	T/A	13/16	1,534,593	$2.310	68.83s
Selisih	0.0	0.0		0	0	$0.000	0ms

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Gemini 3.1 Flash Lite PreviewhighvsGemini 3.5 Flashhigh Gemini 3.1 Flash Lite PreviewhighvsGemini 3 Flash Previewmedium Gemini 3.1 Flash Lite PreviewhighvsNemotron 3 Ultra 550b A55bmediumTersedia gratis Gemini 3.1 Flash Lite PreviewhighvsGPT-5.5low

Rincian Kategori

Kategori	Skor	Konsistensi
Trik anti-AI	10.0	10.0
Gabungan	10.0	10.0
Parsing dan ekstraksi data	10.0	10.0
Spesifik domain	5.3	10.0
Kecerdasan umum	10.0	10.0
Kepatuhan instruksi	9.8	10.0
Pemecahan teka-teki	7.7	10.0
Pemanggilan alat	10.0	10.0

Gemini 3.1 Flash Lite Preview

Hamster playing table tennis

#13 Gemini 3.1 Flash Lite Preview

Grafik

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Rincian Kategori

Model yang Dibandingkan