Navigatie
AI BENCHY
Your ad here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs OpenAI: GPT-5.4 Nano

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-01

Metriek Seed-2.0-Mini Seed-2.0-Mini medium Releasedatum: 2026-02-14 GPT-5.4 Nano GPT-5.4 Nano medium Releasedatum: 2026-03-17
Score 7.5 7.6
Rang #53 #51
Betrouwbaarheid n.v.t. n.v.t.
Consistentie 9.2 9.0
Correcte tests
Slaagpercentage per poging 66.7% 68.5%
Instabiele tests 2 2
Totaal runs 54 54
Kosten per resultaat 0.333 0.747
Totale kosten $0.037 $0.083
Invoerprijs $0.100 / 1M $0.200 / 1M
Uitvoerprijs $0.400 / 1M $1.250 / 1M
Uitvoer-tokens 2,419 2,946
Redeneer-tokens 79,238 58,132
Responstijd (gem.) 69.70s 11.21s
Responstijd (max) 262.83s 94.06s
Responstijd (totaal) 1045.47s 201.80s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 6.6 10.0 50.0% 0 74.75s 360 9,520
GPT-5.4 Nano 8.3 10.0 75.0% 0 4.52s 683 2,254
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 197.31s 448 20,614
GPT-5.4 Nano 10.0 10.0 100.0% 0 13.41s 472 3,616
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 404 29,806
GPT-5.4 Nano 9.8 10.0 100.0% 0 24.13s 349 5,719
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 24.27s 246 2,743
GPT-5.4 Nano 10.0 10.0 100.0% 0 2.54s 234 516
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 3.0 10.0 0.0% 0 0ms 0 0
GPT-5.4 Nano 5.9 7.2 55.6% 1 38.18s 60 43,325
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 5.1 3.4 33.3% 1 36.65s 213 4,210
GPT-5.4 Nano 4.5 10.0 0.0% 0 4.15s 179 443
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 69 2,050
GPT-5.4 Nano 9.8 10.0 100.0% 0 1.88s 95 521
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 8.2 7.2 88.9% 1 25.85s 457 5,060
GPT-5.4 Nano 4.0 7.1 22.2% 1 3.65s 640 1,356
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 222 5,235
GPT-5.4 Nano 10.0 10.0 100.0% 0 7.71s 234 382

Snelle vergelijking

Vergelijkingspaar wisselen