Navigasi
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs OpenAI: GPT-5 Mini

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-06-01

Metrik Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Rilis: 2026-03-03 GPT-5 Mini GPT-5 Mini medium Rilis: 2025-08-07
Skor 7.6 7.2
Peringkat #47 #73
Keandalan 10.0 10.0
Konsistensi 10.0 9.1
Tes benar
Tingkat lulus per percobaan 65.0% 61.7%
Tes tidak stabil 0 2
Total Run 60 60
Biaya per hasil 0.186 1.348
Total Biaya $0.025 $0.149
Harga input $0.250 / 1M $0.250 / 1M
Harga output $1.500 / 1M $2.000 / 1M
Token output 2,280 6,723
Token penalaran 8,829 63,082
Waktu respons (rata-rata) 2.85s 23.75s
Waktu respons (maks) 11.91s 88.15s
Waktu respons (total) 57.08s 475.03s

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Trik anti-AI Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.1 Flash Lite Preview 8.3 10.0 75.0% 0 2.12s 462 1,638
GPT-5 Mini 7.1 7.6 66.7% 1 13.86s 1,715 6,378
Pemrograman Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.1 Flash Lite Preview 6.8 10.0 50.0% 0 1.56s 654 723
GPT-5 Mini 10.0 10.0 100.0% 0 30.74s 580 12,544
Gabungan Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 11.91s 225 762
GPT-5 Mini 10.0 10.0 100.0% 0 88.15s 754 11,520
Parsing dan ekstraksi data Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.00s 291 696
GPT-5 Mini 10.0 10.0 100.0% 0 12.58s 453 3,200
Spesifik domain Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 2.36s 18 1,212
GPT-5 Mini 3.6 7.2 22.2% 1 44.63s 293 14,016
Kecerdasan umum Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 1.54s 69 384
GPT-5 Mini 4.5 10.0 0.0% 0 13.50s 349 1,856
Kepatuhan instruksi Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 72 753
GPT-5 Mini 10.0 10.0 100.0% 0 11.59s 310 3,968
Pemecahan teka-teki Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.69s 243 1,248
GPT-5 Mini 5.6 9.8 33.3% 0 15.20s 1,622 6,144
Pemanggilan alat Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 237 993
GPT-5 Mini 10.0 10.0 100.0% 0 18.64s 487 1,600
Pengetahuan umum Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 1.35s 9 420
GPT-5 Mini 3.0 10.0 0.0% 0 9.99s 160 1,856

Perbandingan Cepat

Ganti Pasangan Perbandingan