AI BENCHY
Vergelijken
❤️ Made by XCS

Modelnaam

OpenAI: gpt-oss-120b

Benchmarks gegenereerd uit Aibenchy-testsuites op : 19 feb 2026

Metriek OpenAI: gpt-oss-120b
Rang#12
BedrijfOpenAI
Score 5.75
Consistentie 7.19
Kosten per resultaat 0.0951
Totale kosten $0.00571
Correcte tests 6/12
Slaagpercentage per poging 63.9%
Instabiele tests 4
Uitvoer-tokens 8,060
Redeneer-tokens 23,792

Categorie-uitsplitsing

Categorie Volledig geslaagde tests Score Consistentie Slaagpercentage per poging Instabiele tests Redeneerscore Kosten
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 10.00 $0.00029
Data parsing and extraction 1/2 5.50 5.81 83.3% 1 10.00 $0.00052
Domain specific 0/3 1.00 4.41 22.2% 2 8.53 $0.00393
Instructions following 2/2 10.00 10.00 100.0% 0 9.50 $0.00040
Puzzle Solving 1/3 5.00 7.13 44.4% 1 7.89 $0.00059

Vergeleken modellen

Vergelijk OpenAI: gpt-oss-120b met...

#11 · OpenAI

OpenAI: GPT-5 Nano

Redenering (medium)

Score: 5.92

Consistentie: 6.03

Slaagpercentage per poging: 72.2%

Instabiele tests: 6

Kosten per resultaat: 0.4675

Correcte tests: 6/12

Totale kosten: $0.02806

Vergelijken

#13 · Anthropic

Anthropic: Claude Sonnet 4.6

Zonder redenering

Score: 5.75

Consistentie: 9.42

Slaagpercentage per poging: 52.8%

Instabiele tests: 1

Kosten per resultaat: 0.9480

Correcte tests: 6/12

Totale kosten: $0.05688

Vergelijken

#10 · Google

Google: Gemini 3 Flash Preview

Zonder redenering

Score: 6.25

Consistentie: 8.60

Slaagpercentage per poging: 66.7%

Instabiele tests: 2

Kosten per resultaat: 0.0754

Correcte tests: 7/12

Totale kosten: $0.00528

Vergelijken

Snelle vergelijking

Vergelijk OpenAI: gpt-oss-120b met...