Navigation
AI BENCHY
Your ad here

AI BENCHY Compare

Inception: Mercury 2 vs NVIDIA: Nemotron 3 Super

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-04-29

Metrik Mercury 2 Mercury 2 none Veröffentlichung: 2026-02-24 Nemotron 3 Super Nemotron 3 Super none Veröffentlichung: 2026-03-11 Kostenlos verfügbar
Punktzahl 4.8 5.1
Rang #121 #116
Zuverlässigkeit k. A. k. A.
Konsistenz 9.0 8.2
Korrekte Tests
Erfolgsquote pro Versuch 27.8% 35.2%
Instabile Tests 2 4
Gesamtläufe 54 52
Kosten pro Ergebnis 0.165 0.000
Gesamtkosten $0.007 $0.000
Eingabepreis $0.250 / 1M $0.090 / 1M
Ausgabepreis $0.750 / 1M $0.450 / 1M
Ausgabe-Token 1,625 4,760
Denk-Token 0 0
Antwortzeit (Durchschnitt) 613ms 8.54s
Antwortzeit (Maximum) 1.27s 24.97s
Antwortzeit (Gesamt) 11.04s 153.69s

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Anti-KI-Tricks Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Mercury 2 3.0 10.0 0.0% 0 483ms 286 0
Nemotron 3 Super 4.8 10.0 25.0% 0 7.43s 2,174 0
Programmierung Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Mercury 2 3.6 8.9 0.0% 0 969ms 310 0
Nemotron 3 Super 3.3 1.6 33.3% 1 2.99s 535 0
Kombiniert Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Mercury 2 3.0 10.0 0.0% 0 606ms 131 0
Nemotron 3 Super 3.0 10.0 0.0% 0 19.98s 124 0
Datenanalyse und -extraktion Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Mercury 2 7.3 5.9 83.3% 1 667ms 180 0
Nemotron 3 Super 10.0 10.0 100.0% 0 7.92s 249 0
Domänenspezifisch Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Mercury 2 5.3 7.2 44.4% 1 534ms 46 0
Nemotron 3 Super 3.6 7.2 22.2% 1 6.23s 26 0
Allgemeine Intelligenz Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Mercury 2 4.8 10.0 0.0% 0 628ms 159 0
Nemotron 3 Super 4.2 9.9 0.0% 0 24.97s 170 0
Befolgung von Anweisungen Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Mercury 2 6.5 10.0 50.0% 0 551ms 82 0
Nemotron 3 Super 4.9 6.9 33.3% 1 1.50s 66 0
Rätsellösen Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Mercury 2 3.1 10.0 0.0% 0 533ms 234 0
Nemotron 3 Super 5.7 10.0 33.3% 0 7.50s 1,135 0
Werkzeugaufrufe Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Mercury 2 10.0 10.0 100.0% 0 1.27s 197 0
Nemotron 3 Super 4.7 1.6 66.7% 1 16.00s 281 0

Schnellvergleich

Vergleichspaar wechseln