Navigatie
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.4 Nano vs StepFun: Step 3.5 Flash

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-03-17

Metriek GPT-5.4 Nano GPT-5.4 Nano medium Releasedatum: 2026-03-17 Step 3.5 Flash Step 3.5 Flash medium Releasedatum: 2026-02-01 Gratis beschikbaar
Rang #28 #22
Score 7.4 7.9
Consistentie 9.0 9.1
Kosten per resultaat 0.769 0.000
Totale kosten $0.077 $0.000
Correcte tests
Slaagpercentage per poging 66.7% 70.6%
Instabiele tests 2 2
Totaal runs 51 49
Uitvoer-tokens 2,474 71,904
Redeneer-tokens 54,516 155,607
Responstijd (gem.) 11.08s 26.78s
Responstijd (max) 94.06s 170.45s
Responstijd (totaal) 188.39s 294.58s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.4 Nano 8.3 10.0 75.0% 0 4.52s 683 2,254
Step 3.5 Flash 10.0 10.0 100.0% 0 13.56s 14,376 17,668
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.4 Nano 9.8 10.0 100.0% 0 24.13s 349 5,719
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.4 Nano 10.0 10.0 100.0% 0 2.54s 234 516
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.4 Nano 5.9 7.2 55.6% 1 38.18s 60 43,325
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 45,350 90,436
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.4 Nano 4.5 10.0 0.0% 0 4.15s 179 443
Step 3.5 Flash 5.5 10.0 0.0% 0 6.54s 2,214 2,584
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.4 Nano 9.8 10.0 100.0% 0 1.88s 95 521
Step 3.5 Flash 8.5 6.8 83.3% 1 4.98s 2,284 3,412
Puzzle Solving Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.4 Nano 4.0 7.1 22.2% 1 3.65s 640 1,356
Step 3.5 Flash 5.3 10.0 33.3% 0 7.72s 5,629 10,835
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.4 Nano 10.0 10.0 100.0% 0 7.71s 234 382
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802

Snelle vergelijking

Vergelijkingspaar wisselen