Navigasi
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite vs MiniMax: MiniMax M3

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-06-01

Metrik Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite low Rilis: 2026-05-08 MiniMax M3 MiniMax M3 medium Rilis: 2026-06-01
Skor 7.4 7.3
Peringkat #55 #65
Keandalan 10.0 9.6
Konsistensi 9.2 8.4
Tes benar
Tingkat lulus per percobaan 65.0% 68.3%
Tes tidak stabil 2 6
Total Run 60 60
Biaya per hasil 0.217 1.083
Total Biaya $0.026 $0.120
Harga input $0.250 / 1M $0.300 / 1M
Harga output $1.500 / 1M $1.200 / 1M
Token output 2,726 46,884
Token penalaran 8,951 85,935
Waktu respons (rata-rata) 1.92s 68.44s
Waktu respons (maks) 5.66s 431.03s
Waktu respons (total) 38.45s 1300.32s

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Trik anti-AI Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.1 Flash Lite 7.3 6.2 75.0% 2 1.84s 1,013 1,548
MiniMax M3 5.5 3.7 66.7% 3 14.95s 874 3,414
Pemrograman Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.1 Flash Lite 6.8 10.0 50.0% 0 1.71s 465 763
MiniMax M3 7.5 10.0 66.7% 1 185.58s 4,071 26,059
Gabungan Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 4.48s 348 975
MiniMax M3 10.0 10.0 100.0% 0 65.30s 1,306 6,253
Parsing dan ekstraksi data Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.44s 291 697
MiniMax M3 10.0 10.0 100.0% 0 14.92s 514 3,164
Spesifik domain Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.1 Flash Lite 5.3 10.0 33.3% 0 1.52s 15 1,214
MiniMax M3 6.0 10.0 44.4% 1 233.13s 16,254 19,070
Kecerdasan umum Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.1 Flash Lite 4.0 10.0 0.0% 0 1.37s 69 438
MiniMax M3 5.1 3.4 33.3% 1 33.25s 2,487 2,523
Kepatuhan instruksi Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.52s 72 760
MiniMax M3 9.8 10.0 100.0% 0 6.14s 103 920
Pemecahan teka-teki Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.40s 210 1,191
MiniMax M3 7.9 9.9 66.7% 0 49.91s 11,946 13,761
Pemanggilan alat Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 5.66s 234 945
MiniMax M3 10.0 10.0 100.0% 0 11.91s 281 555
Pengetahuan umum Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token output Token penalaran
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 1.46s 9 420
MiniMax M3 3.0 10.0 0.0% 0 100.80s 9,048 10,216

Perbandingan Cepat

Ganti Pasangan Perbandingan