Navigatie
AI BENCHY
Your ad here

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs OpenAI: gpt-oss-120b

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-04-29

Metriek Gemini 3 Flash Preview Gemini 3 Flash Preview medium Releasedatum: 2025-12-17 gpt-oss-120b gpt-oss-120b medium Releasedatum: 2025-08-05 Gratis beschikbaar
Score 10.0 5.8
Rang #1 #88
Betrouwbaarheid n.v.t. n.v.t.
Consistentie 10.0 7.2
Correcte tests
Slaagpercentage per poging 100.0% 51.9%
Instabiele tests 0 6
Totaal runs 18 54
Kosten per resultaat 0.600 0.144
Totale kosten $0.108 $0.011
Invoerprijs $0.500 / 1M $0.000 / 1M
Uitvoerprijs $3.000 / 1M $0.000 / 1M
Uitvoer-tokens 655 13,493
Redeneer-tokens 33,749 36,879
Responstijd (gem.) 12.11s 16.08s
Responstijd (max) 82.37s 50.92s
Responstijd (totaal) 217.93s 176.88s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.26s 110 1,076
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 3,518 2,177
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 82.37s 144 16,257
gpt-oss-120b 4.3 1.1 66.7% 1 26.33s 228 2,549
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 23.58s 117 3,495
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 694 5,072
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 7.62s 93 2,197
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 241 1,114
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 14.81s 4 7,228
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 6,784 20,606
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 6.34s 24 635
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 107 387
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.30s 24 903
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 126 1,799
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.86s 61 1,455
gpt-oss-120b 3.2 4.7 22.2% 2 11.80s 1,508 2,092
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 9.78s 78 503
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 287 1,083

Snelle vergelijking

Vergelijkingspaar wisselen