Navigation
AI BENCHY
Advertise here

AI BENCHY Compare

Nemotron 3 Ultra 550b A55b vs StepFun: Step 3.7 Flash

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-06-04

Metrik Nemotron 3 Ultra 550b A55b Nemotron 3 Ultra 550b A55b medium Veröffentlichung: 2026-06-04 Kostenlos verfügbar Step 3.7 Flash Step 3.7 Flash low Veröffentlichung: 2026-05-29
Punktzahl 7.5 7.3
Rang #41 #57
Zuverlässigkeit 9.7 10.0
Konsistenz 8.8 8.4
Korrekte Tests
Erfolgsquote pro Versuch 69.8% 68.3%
Instabile Tests 3 4
Gesamtläufe 63 63
Kosten pro Ergebnis 0.000 2.840
Gesamtkosten $0.000 $0.341
Eingabepreis $0.000 / 1M $0.200 / 1M
Ausgabepreis $0.000 / 1M $1.150 / 1M
Gesamte Eingabe-Token 46,813 40,101
Ausgabe-Token 18,002 289,325
Denk-Token 53,091 0
Antwortzeit (Durchschnitt) 15.05s 15.74s
Antwortzeit (Maximum) 43.93s 124.75s
Antwortzeit (Gesamt) 316.09s 330.63s

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Anti-KI-Tricks Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Eingabe-Token Ausgabe-Token Denk-Token
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 8.62s 780 835 1,485
Step 3.7 Flash 8.7 7.9 91.7% 1 4.02s 756 10,896 0
Programmierung Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Eingabe-Token Ausgabe-Token Denk-Token
Nemotron 3 Ultra 550b A55b 8.4 7.4 88.9% 1 26.53s 7,686 2,854 17,725
Step 3.7 Flash 8.2 7.2 88.9% 1 9.46s 7,437 18,685 0
Kombiniert Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Eingabe-Token Ausgabe-Token Denk-Token
Nemotron 3 Ultra 550b A55b 9.8 10.0 100.0% 0 43.93s 17,574 1,040 3,590
Step 3.7 Flash 10.0 10.0 100.0% 0 7.98s 13,683 6,426 0
Datenanalyse und -extraktion Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Eingabe-Token Ausgabe-Token Denk-Token
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 5.68s 7,989 473 1,285
Step 3.7 Flash 7.3 5.8 83.3% 1 2.29s 7,398 2,667 0
Domänenspezifisch Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Eingabe-Token Ausgabe-Token Denk-Token
Nemotron 3 Ultra 550b A55b 3.5 4.4 33.3% 2 24.90s 858 11,169 16,249
Step 3.7 Flash 5.3 7.2 44.4% 1 43.31s 828 104,487 0
Allgemeine Intelligenz Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Eingabe-Token Ausgabe-Token Denk-Token
Nemotron 3 Ultra 550b A55b 3.7 9.5 0.0% 0 2.52s 360 70 235
Step 3.7 Flash 3.4 9.3 0.0% 0 7.00s 525 4,604 0
Befolgung von Anweisungen Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Eingabe-Token Ausgabe-Token Denk-Token
Nemotron 3 Ultra 550b A55b 9.8 10.0 100.0% 0 6.35s 765 182 1,243
Step 3.7 Flash 9.8 10.0 100.0% 0 1.58s 735 1,857 0
Rätsellösen Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Eingabe-Token Ausgabe-Token Denk-Token
Nemotron 3 Ultra 550b A55b 5.5 9.9 33.3% 0 3.54s 792 771 2,055
Step 3.7 Flash 5.5 9.9 33.3% 0 1.84s 756 3,564 0
Werkzeugaufrufe Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Eingabe-Token Ausgabe-Token Denk-Token
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 7.72s 9,781 304 984
Step 3.7 Flash 10.0 10.0 100.0% 0 3.25s 7,746 1,360 0
Allgemeinwissen Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Eingabe-Token Ausgabe-Token Denk-Token
Nemotron 3 Ultra 550b A55b 3.0 10.0 0.0% 0 38.47s 228 304 8,240
Step 3.7 Flash 3.0 10.0 0.0% 0 124.75s 237 134,779 0

Schnellvergleich

Vergleichspaar wechseln