#90

Mistral Small 4

Mistral Rilis: 2026-03-16 Diuji pada: 2026-04-11 01:44 mistralai/mistral-small-2603::none

(medium) (none)

Ringkasan

Mistral Small 4 mendapat skor 5.2 di AI BENCHY dan berada di peringkat #90. Model ini memiliki reliabilitas T/A, tingkat keberhasilan 31.5%, total biaya $0.006, dan waktu respons rata-rata 665ms.

Yang membuat Mistral Small 4 unik: Model ini paling menonjol di Spesifik domain, dengan peringkat #2, sementara Pemecahan teka-teki adalah area terlemahnya di #18. Total biaya benchmark-nya sangat rendah untuk kisaran skornya. Model ini terasa cepat dibandingkan model serupa.

Skor

5.2

Konsistensi

9.5

Keandalan

T/A

Total biaya (harga saat ini)

$0.006

Total token output

2,207

Total token input

Harga input

$0.150 / 1M

Harga output

$0.600 / 1M

Tes benar

Tes Salah: 13

Tingkat lulus per percobaan: 31.5%

Tes tidak stabil

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

665ms

Waktu respons (maks): 1.72s

Waktu respons (total): 11.97s

Jawaban salah: 11 Tidak mengikuti instruksi: 2

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#90 Mistral Small 4

none

Biaya: $0.002
Waktu: 10.4s
Token: 2,370 tok

Riwayat run

Diuji pada	Skor	Keandalan	Total Biaya	Bandingkan
2026-07-16 22:21 Tes baru ditambahkan	5.1	10.0	$0.022	Bandingkan
2026-06-04 13:41 Tes baru ditambahkan	4.9	10.0	$0.007	Bandingkan
2026-05-22 00:14 Suite berubah	5.0	10.0	$0.007	Bandingkan
2026-04-11 01:44 Run pertama yang tercatat	5.2	T/A	$0.006	Run saat ini

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Mistral Small 4nonevsInklingnone Mistral Small 4nonevsQwen3 Coder Nextnone Mistral Small 4nonevsLing-2.6-1Tnone Mistral Small 4nonevsMistral Small 4medium Mistral Small 4nonevsQwen3.6 35B A3Bnone Mistral Small 4nonevsMiMo-V2.5none Mistral Small 4nonevsLaguna XS 2.1noneTersedia gratis Mistral Small 4nonevsQwen3.5-9Bnone Mistral Small 4nonevsLaguna S 2.1highTersedia gratis Mistral Small 4nonevsNorth Mini CodenoneTersedia gratis

Rincian Kategori

Kategori	Skor	Konsistensi
Trik anti-AI	3.4	7.9
Pemrograman	4.5	9.0
Gabungan	3.0	10.0
Parsing dan ekstraksi data	10.0	10.0
Spesifik domain	5.3	10.0
Kecerdasan umum	4.0	10.0
Kepatuhan instruksi	6.5	10.0
Pemecahan teka-teki	3.1	9.9
Pemanggilan alat	10.0	10.0

Mistral Small 4

Hamster playing table tennis

#90 Mistral Small 4

Grafik

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Rincian Kategori

Model yang Dibandingkan