#53

Gemma 4 31B

Google Rilis: 2026-04-02 Diuji pada: 2026-04-14 00:56 google/gemma-4-31b-it::none

(medium) (none)

Ringkasan

Gemma 4 31B mendapat skor 6.9 di AI BENCHY dan berada di peringkat #53. Model ini memiliki reliabilitas T/A, tingkat keberhasilan 55.6%, total biaya $0.003, dan waktu respons rata-rata 4.02s.

Yang membuat Gemma 4 31B unik: Model ini paling menonjol di Pemrograman, dengan peringkat #1, sementara Gabungan adalah area terlemahnya di #14. Total biaya benchmark-nya sangat rendah untuk kisaran skornya.

Skor

6.9

Konsistensi

10.0

Keandalan

T/A

Total biaya (harga saat ini)

$0.003

Total token output

1,359

Total token input

Harga input

$0.130 / 1M

Harga output

$0.380 / 1M

Tes benar

Tes Salah: 8

Tingkat lulus per percobaan: 55.6%

Tes tidak stabil

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

4.02s

Waktu respons (maks): 26.13s

Waktu respons (total): 64.33s

Jawaban salah: 5 Kesalahan API: 2 Tidak mengikuti instruksi: 1

Showcase generasi

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#53 Gemma 4 31B

none

Biaya: $0.001
Waktu: 12.8s
Token: 795 tok

Riwayat run

Diuji pada	Skor	Keandalan	Total Biaya	Bandingkan
2026-06-04 14:04 Tes baru ditambahkan	6.5	10.0	$0.004 ↓	Bandingkan
2026-05-22 00:30 Suite berubah	6.7	10.0	$0.003	Bandingkan
2026-04-14 00:56 Run pertama yang tercatat	6.9	T/A	$0.003	Run saat ini

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Gemma 4 31BnoneTersedia gratisvsGemini 3.1 Flash Lite Previewnone Gemma 4 31BnoneTersedia gratisvsNemotron 3 SupermediumTersedia gratis Gemma 4 31BnoneTersedia gratisvsGemini 3.1 Flash Lite Previewlow Gemma 4 31BnoneTersedia gratisvsGemma 4 31BmediumTersedia gratis Gemma 4 31BnoneTersedia gratisvsGemini 3.5 Flashhigh Gemma 4 31BnoneTersedia gratisvsGemini 3 Flash Previewmedium Gemma 4 31BnoneTersedia gratisvsNemotron 3 Ultra 550b A55bmediumTersedia gratis Gemma 4 31BnoneTersedia gratisvsGPT-5.5low

Rincian Kategori

Kategori	Skor	Konsistensi
Trik anti-AI	6.5	10.0
Pemrograman	10.0	10.0
Gabungan	3.0	10.0
Parsing dan ekstraksi data	10.0	10.0
Spesifik domain	7.7	10.0
Kecerdasan umum	10.0	10.0
Kepatuhan instruksi	6.5	10.0
Pemecahan teka-teki	5.5	10.0
Pemanggilan alat	3.0	10.0

Gemma 4 31B

Hamster playing table tennis

#53 Gemma 4 31B

Grafik

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Rincian Kategori

Model yang Dibandingkan