Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5 Nano vs OpenAI: gpt-oss-120b

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-19

Metriek GPT-5 Nano GPT-5 Nano medium Releasedatum: 2025-08-07 gpt-oss-120b gpt-oss-120b medium Releasedatum: 2025-08-05 Gratis beschikbaar
Score 6.2 5.7
Rang #90 #106
Betrouwbaarheid 10.0 10.0
Consistentie 7.0 7.4
Correcte tests
Slaagpercentage per poging 57.9% 49.1%
Instabiele tests 7 6
Totaal runs 57 57
Kosten per resultaat 0.856 0.152
Totale kosten $0.069 $0.011
Invoerprijs $0.050 / 1M $0.000 / 1M
Uitvoerprijs $0.400 / 1M $0.000 / 1M
Uitvoer-tokens 5,214 16,594
Redeneer-tokens 162,432 40,637
Responstijd (gem.) 42.13s 16.95s
Responstijd (max) 204.02s 50.92s
Responstijd (totaal) 505.59s 203.39s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5 Nano 6.5 7.9 58.3% 1 25.50s 1,221 21,184
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 3,518 2,177
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5 Nano 6.7 3.5 66.7% 1 40.73s 480 12,992
gpt-oss-120b 4.3 1.1 66.7% 1 26.33s 228 2,549
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5 Nano 10.0 10.0 100.0% 0 65.96s 578 17,984
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 694 5,072
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5 Nano 3.7 1.7 50.0% 2 21.42s 453 10,560
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 241 1,114
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5 Nano 5.2 4.4 55.6% 2 204.02s 237 64,448
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 6,784 20,606
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5 Nano 4.1 10.0 0.0% 0 17.51s 202 4,608
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 107 387
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5 Nano 9.8 10.0 100.0% 0 11.90s 382 4,096
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 126 1,799
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5 Nano 5.3 7.2 44.4% 1 19.81s 869 13,440
gpt-oss-120b 3.2 4.7 22.2% 2 11.80s 1,508 2,092
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5 Nano 10.0 10.0 100.0% 0 33.30s 558 6,976
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 287 1,083
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5 Nano 3.0 10.0 0.0% 0 20.13s 234 6,144
gpt-oss-120b 3.0 10.0 0.0% 0 26.51s 3,101 3,758

Snelle vergelijking

Vergelijkingspaar wisselen