AI BENCHY
AD
Track all your projects in one dashboard. Get ๐Ÿ“Šstats, ๐Ÿ”ฅheatmaps and ๐Ÿ‘€recordings in one self-hosted dashboard.
uxwizz.com

#59

Nemotron 3 Super 120b A12b

NVIDIA ยท Rilis: 2026-03-11 ยท nvidia/nemotron-3-super-120b-a12b::none

Skor Rata-rata

3.4

Biaya per hasil

0.000

Konsistensi

8.6

Total Biaya

$0.000

Tes benar

Tes Salah: 13

Tingkat lulus per percobaan: 31.3%

Tes tidak stabil

3

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

8.90s

Waktu respons (maks): 24.97s

Waktu respons (total): 142.40s

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Total token output

Perbandingan Cepat

Rincian Kategori

Kategori Skor Rata-rata Konsistensi Tes benar
Trik anti-AI 10.0 10.0
Gabungan 10.0 10.0
Parsing dan ekstraksi data 9.9 10.0
Spesifik domain 10.0 7.2
Kecerdasan umum 3.0 9.9
Kepatuhan instruksi 4.5 6.9
Pemecahan teka-teki 4.7 10.0
Pemanggilan alat 10.0 1.6

Model yang Dibandingkan