#79

Mistral Small 4

Mistral Rilis: 2026-03-16 Diuji pada: 2026-04-11 01:44 mistralai/mistral-small-2603::medium

(medium) (none)

Ringkasan

Mistral Small 4 mendapat skor 5.7 di AI BENCHY dan berada di peringkat #79. Model ini memiliki reliabilitas T/A, tingkat keberhasilan 50.0%, total biaya $0.034, dan waktu respons rata-rata 5.64s.

Yang membuat Mistral Small 4 unik: Model ini paling menonjol di Pemrograman, dengan peringkat #3, sementara Gabungan adalah area terlemahnya di #18. Total biaya benchmark-nya sangat rendah untuk kisaran skornya.

Skor

5.7

Konsistensi

6.8

Keandalan

T/A

Total biaya (harga saat ini)

$0.034

Total token output

54,492

Total token input

Harga input

$0.150 / 1M

Harga output

$0.600 / 1M

Tes benar

Tes Salah: 13

Tingkat lulus per percobaan: 50.0%

Tes tidak stabil

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

5.64s

Waktu respons (maks): 30.49s

Waktu respons (total): 101.52s

Jawaban salah: 8 Tidak mengikuti instruksi: 3 Kesalahan API: 2

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#79 Mistral Small 4

medium

Biaya: $0.006
Waktu: 47.9s
Token: 9,857 tok

Riwayat run

Diuji pada	Skor	Keandalan	Total Biaya	Bandingkan
2026-07-16 22:23 Tes baru ditambahkan	5.1	10.0	$0.096	Bandingkan
2026-06-04 13:43 Tes baru ditambahkan	5.3	10.0	$0.068	Bandingkan
2026-05-22 00:16 Suite berubah	5.4	10.0	$0.056	Bandingkan
2026-04-11 01:44 Run pertama yang tercatat	5.7	T/A	$0.034	Run saat ini

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Mistral Small 4mediumvsQwen3 Coder Nextnone Mistral Small 4mediumvsMiMo-V2.5none Mistral Small 4mediumvsMistral Small 4none Mistral Small 4mediumvsQwen3.5-9Bnone Mistral Small 4mediumvsInklingnone Mistral Small 4mediumvsNorth Mini CodenoneTersedia gratis Mistral Small 4mediumvsLing-2.6-1Tnone Mistral Small 4mediumvsMiniMax M2.7medium Mistral Small 4mediumvsQwen3.6 35B A3Bnone Mistral Small 4mediumvsLaguna S 2.1lowTersedia gratis

Rincian Kategori

Kategori	Skor	Konsistensi
Trik anti-AI	5.6	3.8
Pemrograman	6.7	3.5
Gabungan	3.0	10.0
Parsing dan ekstraksi data	7.3	5.9
Spesifik domain	5.3	7.2
Kecerdasan umum	4.8	10.0
Kepatuhan instruksi	7.3	5.8
Pemecahan teka-teki	3.4	9.7
Pemanggilan alat	10.0	10.0

Mistral Small 4

Hamster playing table tennis

#79 Mistral Small 4

Grafik

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Rincian Kategori

Model yang Dibandingkan