#60
Stepfun
Veröffentlichung: 2026-05-29
Getestet am: 2026-05-29 11:49
stepfun/step-3.7-flash::low
7.4
Konsistenz
8.7
10.0
Gesamte Ausgabe-Token
285,209
Eingabepreis
$0.200 / 1M
Ausgabepreis
$1.150 / 1M
Instabile Tests
3
Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).
Diagramme
Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.
Punktzahl vs Gesamtkosten
Antwortzeit (Durchschnitt)
Punktzahl vs Antwortzeit (Durchschnitt)
Gesamte Ausgabe-Token
Punktzahl vs Gesamte Ausgabe-Token
Schnellvergleich
Step 3.7 FlashlowvsGemini 3.1 Flash Lite PreviewlowStep 3.7 FlashlowvsMiMo-V2-PromediumStep 3.7 FlashlowvsClaude Sonnet 4.6mediumStep 3.7 FlashlowvsMiMo-V2.5-PromediumStep 3.7 FlashlowvsGemini 3.1 Flash Lite PreviewnoneStep 3.7 FlashlowvsGemini 3 Flash PreviewmediumStep 3.7 FlashlowvsGemini 3.5 FlashhighStep 3.7 FlashlowvsRing-2.6-1TmediumStep 3.7 FlashlowvsGemini 3.5 Flashlow
Kategorieaufschlüsselung
| Kategorie | Punktzahl | Konsistenz | Korrekte Tests |
|---|---|---|---|
| Anti-KI-Tricks | 8.7 | 7.9 | |
| Programmierung | 10.0 | 10.0 | |
| Kombiniert | 10.0 | 10.0 | |
| Datenanalyse und -extraktion | 7.3 | 5.8 | |
| Domänenspezifisch | 5.3 | 7.2 | |
| Allgemeine Intelligenz | 3.4 | 9.3 | |
| Befolgung von Anweisungen | 9.8 | 10.0 | |
| Rätsellösen | 5.5 | 9.9 | |
| Werkzeugaufrufe | 10.0 | 10.0 | |
| Allgemeinwissen | 3.0 | 10.0 |