Navigasi
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

MiniMax: MiniMax M3 vs OpenAI: GPT-5.4 Nano

Ringkasan

Perbandingan benchmark MiniMax M3 vs GPT-5.4 Nano: MiniMax M3 unggul dalam skor rata-rata dengan 7.6 vs 7.5. GPT-5.4 Nano memiliki biaya benchmark lebih rendah di $0.107 vs $0.131. GPT-5.4 Nano lebih cepat di 11.95s vs 68.17s, dengan tingkat keberhasilan 65.1% vs 63.5%.

Model yang direkomendasikan: GPT-5.4 Nano - Its score stays close to the best score here (7.5 vs 7.6), while responding about 5.7x faster than MiniMax M3.

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-06-12

Metrik MiniMax M3 MiniMax M3 medium Rilis: 2026-06-01 GPT-5.4 Nano GPT-5.4 Nano medium Rilis: 2026-03-17
Skor 7.6 7.5
Peringkat #43 #48
Keandalan 9.6 10.0
Konsistensi 7.9 8.4
Tes benar
Tingkat lulus per percobaan 65.1% 63.5%
Tes tidak stabil 5 4
Total Run 63 63
Biaya per hasil 1.187 0.969
Total Biaya $0.131 $0.107
Harga input $0.300 / 1M $0.200 / 1M
Harga output $1.200 / 1M $1.250 / 1M
Total token input 46,546 35,434
Token output 49,036 3,014
Token penalaran 92,543 76,520
Waktu respons (rata-rata) 68.17s 11.95s
Waktu respons (maks) 431.03s 94.06s
Waktu respons (total) 1363.38s 250.98s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#43 MiniMax M3

medium
Cost
$0.012
Time
154.4s
Tokens
10,018 tok

#48 GPT-5.4 Nano

medium
Cost
$0.007
Time
24.6s
Tokens
4,943 tok

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Trik anti-AI Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token input Token output Token penalaran
MiniMax M3 5.5 3.7 66.7% 3 14.95s 2,526 874 3,414
GPT-5.4 Nano 8.3 10.0 75.0% 0 4.52s 606 683 2,254
Pemrograman Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token input Token output Token penalaran
MiniMax M3 6.1 6.5 55.6% 1 144.74s 5,804 6,223 32,667
GPT-5.4 Nano 6.1 4.7 66.7% 2 19.12s 7,305 516 20,778
Gabungan Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token input Token output Token penalaran
MiniMax M3 10.0 10.0 100.0% 0 65.30s 14,760 1,306 6,253
GPT-5.4 Nano 9.8 10.0 100.0% 0 24.13s 12,345 349 5,719
Parsing dan ekstraksi data Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token input Token output Token penalaran
MiniMax M3 10.0 10.0 100.0% 0 14.92s 8,088 514 3,164
GPT-5.4 Nano 10.0 10.0 100.0% 0 2.54s 7,140 234 516
Spesifik domain Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token input Token output Token penalaran
MiniMax M3 5.5 9.3 33.3% 0 233.13s 869 16,254 19,070
GPT-5.4 Nano 5.9 7.2 55.6% 1 38.18s 619 60 43,325
Kecerdasan umum Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token input Token output Token penalaran
MiniMax M3 5.1 3.4 33.3% 1 33.25s 954 2,487 2,523
GPT-5.4 Nano 4.5 10.0 0.0% 0 4.15s 477 179 443
Kepatuhan instruksi Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token input Token output Token penalaran
MiniMax M3 9.8 10.0 100.0% 0 6.14s 1,623 103 920
GPT-5.4 Nano 9.8 10.0 100.0% 0 1.88s 660 95 521
Pemecahan teka-teki Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token input Token output Token penalaran
MiniMax M3 7.9 9.9 66.7% 0 49.91s 2,079 11,946 13,761
GPT-5.4 Nano 4.1 7.2 22.2% 1 3.79s 642 594 1,408
Pemanggilan alat Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token input Token output Token penalaran
MiniMax M3 10.0 10.0 100.0% 0 11.91s 9,168 281 555
GPT-5.4 Nano 10.0 10.0 100.0% 0 7.71s 5,445 234 382
Pengetahuan umum Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token input Token output Token penalaran
MiniMax M3 3.0 10.0 0.0% 0 100.80s 675 9,048 10,216
GPT-5.4 Nano 3.0 10.0 0.0% 0 4.81s 195 70 1,174

Perbandingan Cepat

Ganti Pasangan Perbandingan