AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

#58

gpt-oss-120b

OpenAI · Releasedatum: 2025-08-05 · openai/gpt-oss-120b::medium

Score

6.0

Consistentie

7.6

Totale kosten

$0.010

Totaal aantal uitvoer-tokens

47,595

Invoerprijs

$0.039 / 1M

Uitvoerprijs

$0.190 / 1M

Correcte tests

Foute tests: 10

Slaagpercentage per poging: 51.0%

Instabiele tests

5

Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).

Responstijd (gem.)

15.05s

Responstijd (max): 50.92s

Responstijd (totaal): 150.55s

Grafieken

Kies eerst het eerste model en klik daarna op een tweede model om een zij-aan-zijpagina te openen.

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Snelle vergelijking

Categorie-uitsplitsing

Categorie Score Consistentie Correcte tests
Anti-AI-trucs 6.7 9.9
Gecombineerd 10.0 10.0
Gegevensparsering en extractie 6.4 5.9
Domeinspecifiek 2.9 4.4
Algemene intelligentie 4.3 10.0
Instructies opvolgen 9.9 10.0
Puzzeloplossing 3.2 4.7
Toolaanroepen 9.8 10.0

Vergeleken modellen