AI BENCHY
Vergleichen
❤️ Made by XCS

Modellname

OpenAI: gpt-oss-120b

Benchmarks aus Aibenchy-Test-Suites generiert am : 19.02.2026

Metrik OpenAI: gpt-oss-120b
Rang#12
UnternehmenOpenAI
Score 5.75
Konsistenz 7.19
Kosten pro Ergebnis 0.0951
Gesamtkosten $0.00571
Korrekte Tests 6/12
Erfolgsquote pro Versuch 63.9%
Instabile Tests 4
Ausgabe-Token 8,060
Denk-Token 23,792

Kategorieaufschlüsselung

Kategorie Vollständig bestandene Tests Score Konsistenz Erfolgsquote pro Versuch Instabile Tests Begründungswert Kosten
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 10.00 $0.00029
Data parsing and extraction 1/2 5.50 5.81 83.3% 1 10.00 $0.00052
Domain specific 0/3 1.00 4.41 22.2% 2 8.53 $0.00393
Instructions following 2/2 10.00 10.00 100.0% 0 9.50 $0.00040
Puzzle Solving 1/3 5.00 7.13 44.4% 1 7.89 $0.00059

Verglichene Modelle

OpenAI: gpt-oss-120b vergleichen mit...

#11 · OpenAI

OpenAI: GPT-5 Nano

Schlussfolgern (medium)

Score: 5.92

Konsistenz: 6.03

Erfolgsquote pro Versuch: 72.2%

Instabile Tests: 6

Kosten pro Ergebnis: 0.4675

Korrekte Tests: 6/12

Gesamtkosten: $0.02806

Vergleichen

#13 · Anthropic

Anthropic: Claude Sonnet 4.6

Ohne Schlussfolgern

Score: 5.75

Konsistenz: 9.42

Erfolgsquote pro Versuch: 52.8%

Instabile Tests: 1

Kosten pro Ergebnis: 0.9480

Korrekte Tests: 6/12

Gesamtkosten: $0.05688

Vergleichen

#10 · Google

Google: Gemini 3 Flash Preview

Ohne Schlussfolgern

Score: 6.25

Konsistenz: 8.60

Erfolgsquote pro Versuch: 66.7%

Instabile Tests: 2

Kosten pro Ergebnis: 0.0754

Korrekte Tests: 7/12

Gesamtkosten: $0.00528

Vergleichen

Schnellvergleich

OpenAI: gpt-oss-120b vergleichen mit...