Navigasi
AI BENCHY
Advertise here

AI BENCHY Compare

Nemotron 3 Ultra 550b A55b vs Laguna M.1

Ringkasan

Perbandingan benchmark Nemotron 3 Ultra 550b A55b vs Laguna M.1: Nemotron 3 Ultra 550b A55b unggul dalam skor rata-rata dengan 8.1 vs 6.0. Laguna M.1 memiliki biaya benchmark lebih rendah di $0.000 vs $0.177. Laguna M.1 lebih cepat di 2.89s vs 15.05s, dengan tingkat keberhasilan 69.8% vs 31.6%.

Model yang direkomendasikan: Nemotron 3 Ultra 550b A55b - It has the strongest score in this comparison (8.1) and the best overall balance of cost and response time across all 2 models.

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-06-12

Metrik Nemotron 3 Ultra 550b A55b Nemotron 3 Ultra 550b A55b medium Rilis: 2026-06-04 Tersedia gratis Laguna M.1 Laguna M.1 none Rilis: 2026-04-28 Tersedia gratis
Skor 8.1 6.0
Peringkat #29 #101
Keandalan 9.7 9.8
Konsistensi 8.8 8.8
Tes benar
Tingkat lulus per percobaan 69.8% 31.6%
Tes tidak stabil 3 3
Total Run 63 57
Biaya per hasil 0.000 0.000
Total Biaya $0.177 $0.000
Harga input $0.500 / 1M $0.000 / 1M
Harga output $2.500 / 1M $0.000 / 1M
Total token input 46,813 38,147
Token output 18,002 2,054
Token penalaran 53,091 0
Waktu respons (rata-rata) 15.05s 2.89s
Waktu respons (maks) 43.93s 15.42s
Waktu respons (total) 316.09s 43.28s

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Trik anti-AI Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token input Token output Token penalaran
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 8.62s 780 835 1,485
Laguna M.1 3.4 7.9 16.7% 1 705ms 579 34 0
Pemrograman Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token input Token output Token penalaran
Nemotron 3 Ultra 550b A55b 8.4 7.4 88.9% 1 26.53s 7,686 2,854 17,725
Laguna M.1 7.5 3.8 66.7% 1 2.93s 816 543 0
Gabungan Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token input Token output Token penalaran
Nemotron 3 Ultra 550b A55b 9.8 10.0 100.0% 0 43.93s 17,574 1,040 3,590
Laguna M.1 3.0 10.0 0.0% 0 4.32s 19,565 622 0
Parsing dan ekstraksi data Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token input Token output Token penalaran
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 5.68s 7,989 473 1,285
Laguna M.1 10.0 10.0 100.0% 0 3.37s 7,734 246 0
Spesifik domain Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token input Token output Token penalaran
Nemotron 3 Ultra 550b A55b 3.5 4.4 33.3% 2 24.90s 858 11,169 16,249
Laguna M.1 3.6 7.2 22.2% 1 5.50s 834 33 0
Kecerdasan umum Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token input Token output Token penalaran
Nemotron 3 Ultra 550b A55b 3.7 9.5 0.0% 0 2.52s 360 70 235
Laguna M.1 3.0 10.0 0.0% 0 0ms 0 0 0
Kepatuhan instruksi Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token input Token output Token penalaran
Nemotron 3 Ultra 550b A55b 9.8 10.0 100.0% 0 6.35s 765 182 1,243
Laguna M.1 6.3 10.0 50.0% 0 683ms 753 80 0
Pemecahan teka-teki Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token input Token output Token penalaran
Nemotron 3 Ultra 550b A55b 5.5 9.9 33.3% 0 3.54s 792 771 2,055
Laguna M.1 3.0 10.0 0.0% 0 891ms 453 187 0
Pemanggilan alat Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token input Token output Token penalaran
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 7.72s 9,781 304 984
Laguna M.1 10.0 10.0 100.0% 0 7.54s 7,413 309 0
Pengetahuan umum Skor Konsistensi Tingkat lulus per percobaan Tes tidak stabil Tes benar Waktu respons (rata-rata) Token input Token output Token penalaran
Nemotron 3 Ultra 550b A55b 3.0 10.0 0.0% 0 38.47s 228 304 8,240
Laguna M.1 3.0 10.0 0.0% 0 0ms 0 0 0

Perbandingan Cepat

Ganti Pasangan Perbandingan