#91
OpenAI
Veröffentlichung: 2025-08-05
Getestet am: 2026-04-21 12:42
openai/gpt-oss-120b::none
(medium)
(none)
Eingabepreis
$0.000 / 1M
Ausgabepreis
$0.000 / 1M
Instabile Tests
5
Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).
Testverlauf
| Getestet am | Punktzahl | Zuverlässigkeit | Korrekte Tests | Gesamtkosten | Vergleichen |
|---|---|---|---|---|---|
| 2026-05-08 15:31 Suite geändert | 5.2 | 10.0 | $0.011 | Vergleichen | |
| 2026-04-21 12:42 Erster erfasster Lauf | 5.2 | k. A. | $0.009 | Aktueller Lauf |
Diagramme
Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.
Punktzahl vs Gesamtkosten
Antwortzeit (Durchschnitt)
Punktzahl vs Antwortzeit (Durchschnitt)
Gesamte Ausgabe-Token
Punktzahl vs Gesamte Ausgabe-Token
Schnellvergleich
gpt-oss-120bnoneKostenlos verfügbarvsOwl Alphamediumgpt-oss-120bnoneKostenlos verfügbarvsQwen3.5 Plus 2026-04-20nonegpt-oss-120bnoneKostenlos verfügbarvsSeed-2.0-Litenonegpt-oss-120bnoneKostenlos verfügbarvsQwen3.5-35B-A3Bnonegpt-oss-120bnoneKostenlos verfügbarvsGLM 5V Turbononegpt-oss-120bnoneKostenlos verfügbarvsGemini 3 Flash Previewmediumgpt-oss-120bnoneKostenlos verfügbarvsGemini 3.5 Flashhighgpt-oss-120bnoneKostenlos verfügbarvsRing-2.6-1Tmediumgpt-oss-120bnoneKostenlos verfügbarvsGemini 3.5 Flashlow
Kategorieaufschlüsselung
| Kategorie | Punktzahl | Konsistenz | Korrekte Tests |
|---|---|---|---|
| Anti-KI-Tricks | 6.6 | 8.0 | |
| Programmierung | 4.3 | 1.1 | |
| Kombiniert | 3.0 | 10.0 | |
| Datenanalyse und -extraktion | 6.5 | 10.0 | |
| Domänenspezifisch | 3.0 | 10.0 | |
| Allgemeine Intelligenz | 4.6 | 10.0 | |
| Befolgung von Anweisungen | 8.4 | 6.9 | |
| Rätsellösen | 4.5 | 4.8 | |
| Werkzeugaufrufe | 3.0 | 10.0 |