#58

gpt-oss-120b

OpenAI · Veröffentlichung: 2025-08-05 · openai/gpt-oss-120b::medium

6.0

Konsistenz

7.6

$0.010

Gesamte Ausgabe-Token

47,595

Eingabepreis

$0.039 / 1M

Ausgabepreis

$0.190 / 1M

Falsche Tests: 10

Erfolgsquote pro Versuch: 51.0%

Instabile Tests

5

Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).

Antwortzeit (Durchschnitt)

15.05s

Antwortzeit (Maximum): 50.92s

Antwortzeit (Gesamt): 150.55s

Falsche Antwort: 6 Anweisungen nicht befolgt: 4

Diagramme

Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Schnellvergleich

gpt-oss-120bmediumKostenlos verfügbarvsQwen3.5-Flashnone gpt-oss-120bmediumKostenlos verfügbarvsGrok 4.20 Multi Agent Betamedium gpt-oss-120bmediumKostenlos verfügbarvsSeed-2.0-Litenone gpt-oss-120bmediumKostenlos verfügbarvsGPT-5 Nanomedium gpt-oss-120bmediumKostenlos verfügbarvsGemini 2.5 Flashnone gpt-oss-120bmediumKostenlos verfügbarvsGemini 3 Flash Previewmedium gpt-oss-120bmediumKostenlos verfügbarvsGemini 3.1 Pro Previewmedium gpt-oss-120bmediumKostenlos verfügbarvsQwen3.6 Plus Previewmedium

Kategorieaufschlüsselung

Kategorie	Punktzahl	Konsistenz	Korrekte Tests
Anti-KI-Tricks	6.7	9.9
Kombiniert	10.0	10.0
Datenanalyse und -extraktion	6.4	5.9
Domänenspezifisch	2.9	4.4
Allgemeine Intelligenz	4.3	10.0
Befolgung von Anweisungen	9.9	10.0
Rätsellösen	3.2	4.7
Werkzeugaufrufe	9.8	10.0

Verglichene Modelle