Navigare
AI BENCHY
Advertise here

AI BENCHY Compare

Inception: Mercury 2 vs NVIDIA: Nemotron 3 Super

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-06-03

Metrică Mercury 2 Mercury 2 none Lansare: 2026-02-24 Nemotron 3 Super Nemotron 3 Super medium Lansare: 2026-03-11 Disponibil gratuit
Scor 4.6 5.9
Rang #153 #102
Fiabilitate 10.0 10.0
Consistență 9.1 9.2
Teste corecte
Rată de trecere pe încercare 25.0% 43.3%
Teste instabile 2 2
Rulări totale 60 60
Cost per rezultat 0.216 0.004
Cost total $0.009 $0.019
Preț de intrare $0.250 / 1M $0.090 / 1M
Preț de ieșire $0.750 / 1M $0.450 / 1M
Total tokenuri de intrare 25,515 36,614
Tokenuri de ieșire 3,001 14,505
Tokenuri de raționament 0 30,178
Timp de răspuns (mediu) 614ms 20.87s
Timp de răspuns (maxim) 1.27s 87.80s
Timp de răspuns (total) 12.28s 375.66s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Mercury 2 3.0 10.0 0.0% 0 483ms 631 286 0
Nemotron 3 Super 8.3 10.0 75.0% 0 7.85s 686 748 1,305
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Mercury 2 3.5 9.4 0.0% 0 831ms 4,631 1,650 0
Nemotron 3 Super 3.1 9.9 0.0% 0 62.38s 1,362 452 848
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Mercury 2 3.0 10.0 0.0% 0 606ms 4,821 131 0
Nemotron 3 Super 10.0 10.0 100.0% 0 87.80s 15,561 2,021 9,996
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Mercury 2 7.3 5.9 83.3% 1 667ms 6,362 180 0
Nemotron 3 Super 10.0 10.0 100.0% 0 18.16s 7,944 877 2,607
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Mercury 2 5.3 7.2 44.4% 1 534ms 784 46 0
Nemotron 3 Super 2.9 4.4 22.2% 2 16.19s 456 5,255 6,072
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Mercury 2 4.8 10.0 0.0% 0 628ms 495 159 0
Nemotron 3 Super 4.1 10.0 0.0% 0 6.91s 492 105 363
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Mercury 2 6.5 10.0 50.0% 0 551ms 691 82 0
Nemotron 3 Super 7.3 10.0 50.0% 0 6.97s 723 956 2,383
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Mercury 2 3.1 10.0 0.0% 0 535ms 694 251 0
Nemotron 3 Super 3.0 10.0 0.0% 0 3.15s 708 570 1,322
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Mercury 2 10.0 10.0 100.0% 0 1.27s 6,193 197 0
Nemotron 3 Super 10.0 10.0 100.0% 0 39.75s 8,544 270 1,969
Cultură generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Mercury 2 3.0 10.0 0.0% 0 548ms 213 19 0
Nemotron 3 Super 3.0 10.0 0.0% 0 55.32s 138 3,251 3,313

Comparație rapidă

Schimbă perechea de comparație