Navigatie
AI BENCHY
Your ad here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs Google: Gemini 3 Flash Preview

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-04-14

Metriek Seed-2.0-Mini Seed-2.0-Mini medium Releasedatum: 2026-02-14 Gemini 3 Flash Preview Gemini 3 Flash Preview low Releasedatum: 2025-12-17
Score 7.5 8.8
Rang #36 #3
Consistentie 9.2 9.5
Correcte tests
Slaagpercentage per poging 66.7% 85.2%
Instabiele tests 2 1
Totaal runs 54 54
Kosten per resultaat 0.333 0.604
Totale kosten $0.037 $0.091
Invoerprijs $0.100 / 1M $0.500 / 1M
Uitvoerprijs $0.400 / 1M $3.000 / 1M
Uitvoer-tokens 2,419 2,018
Redeneer-tokens 79,238 23,273
Responstijd (gem.) 69.70s 6.01s
Responstijd (max) 262.83s 14.72s
Responstijd (totaal) 1045.47s 108.12s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 6.6 10.0 50.0% 0 74.75s 360 9,520
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.48s 281 3,082
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 197.31s 448 20,614
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 6.94s 426 2,717
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 404 29,806
Gemini 3 Flash Preview 3.0 10.0 0.0% 0 3.27s 326 0
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 24.27s 246 2,743
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 9.40s 279 3,656
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 3.0 10.0 0.0% 0 0ms 0 0
Gemini 3 Flash Preview 5.3 7.2 44.4% 1 8.05s 12 6,410
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 5.1 3.4 33.3% 1 36.65s 213 4,210
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.68s 120 981
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 69 2,050
Gemini 3 Flash Preview 9.9 10.0 100.0% 0 7.02s 71 2,752
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 8.2 7.2 88.9% 1 25.85s 457 5,060
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 6.11s 269 3,260
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 222 5,235
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.99s 234 415

Snelle vergelijking

Vergelijkingspaar wisselen