Ringkasan
Nemotron 3 Nano Omni 30b A3b Reasoning mendapat skor 5.2 di AI BENCHY dan berada di peringkat #107. Model ini memiliki reliabilitas 10.0, tingkat keberhasilan 47.9%, total biaya $0.000, dan waktu respons rata-rata 14.46s.
Yang membuat Nemotron 3 Nano Omni 30b A3b Reasoning unik: Model ini paling menonjol di Trik anti-AI, dengan peringkat #1, sementara Pemrograman adalah area terlemahnya di #10. Total biaya benchmark-nya sangat rendah untuk kisaran skornya. Model ini memakai token reasoning yang sangat tinggi, yang bisa menjelaskan run yang lebih lambat atau lebih mahal.
Model diarsipkan: model ini tidak lagi diperbarui atau diuji pada pengujian baru.
5.2
Konsistensi
5.9
10.0
$0.000
Total token output
235,283
Total token input
0
Harga input
$0.000 / 1M
Harga output
$0.000 / 1M
Tes tidak stabil
8
Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).
Riwayat run
| Diuji pada | Skor | Keandalan | Tes benar | Total Biaya | Bandingkan |
|---|---|---|---|---|---|
| 2026-05-08 15:30 Suite berubah | 4.6 | 10.0 | $0.000 | Bandingkan | |
| 2026-04-28 23:26 Run pertama yang tercatat | 5.2 | 10.0 | $0.000 | Run saat ini |
Perbandingan run
| Run | Skor | Konsistensi | Keandalan | Tes benar | Tes tidak stabil | Total token output | Total token input | Total Biaya | Waktu respons (rata-rata) |
|---|---|---|---|---|---|---|---|---|---|
| 2026-04-28 23:26 · Run pertama yang tercatat | 5.2 | 5.9 | 10.0 | 4/16 | 8 | 235,283 | 0 | $0.000 | 14.46s |
| 2026-05-08 15:30 · Suite berubah | 4.6 | 7.8 | 10.0 | 4/19 | 5 | 229,186 | 11,661 | $0.000 | 17.13s |
| Selisih | +0.6 | -1.9 | 0.0 | +2 | +3 | +6097 | -11661 | $0.000 | -2668ms |
Kedua run ini menggunakan suite benchmark yang berbeda, jadi selisihnya mencerminkan perubahan model sekaligus perubahan suite.
Grafik
Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.
Skor vs Total Biaya
Waktu respons (rata-rata)
Skor vs Waktu respons (rata-rata)
Total token output
Skor vs Total token output
Perbandingan Cepat
Rincian Kategori
| Kategori | Skor | Konsistensi | Tes benar |
|---|---|---|---|
| Trik anti-AI | 7.0 | 5.9 | |
| Pemrograman | 3.3 | 1.7 | |
| Gabungan | 0.0 | 0.0 | |
| Parsing dan ekstraksi data | 7.3 | 5.9 | |
| Spesifik domain | 2.9 | 7.2 | |
| Kecerdasan umum | 4.8 | 9.9 | |
| Kepatuhan instruksi | 6.9 | 6.3 | |
| Pemecahan teka-teki | 3.5 | 4.4 | |
| Pemanggilan alat | 0.0 | 0.0 |