Navigatie
AI BENCHY
Advertise here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs Google: Gemini 3 Flash Preview

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-29

Metriek Seed-2.0-Mini Seed-2.0-Mini medium Releasedatum: 2026-02-14 Gemini 3 Flash Preview Gemini 3 Flash Preview medium Releasedatum: 2025-12-17
Score 7.1 9.8
Rang #75 #1
Betrouwbaarheid 10.0 10.0
Consistentie 9.2 9.6
Correcte tests
Slaagpercentage per poging 60.0% 98.3%
Instabiele tests 2 1
Totaal runs 60 60
Kosten per resultaat 0.397 2.980
Totale kosten $0.044 $0.567
Invoerprijs $0.100 / 1M $0.500 / 1M
Uitvoerprijs $0.400 / 1M $3.000 / 1M
Uitvoer-tokens 2,555 2,000
Redeneer-tokens 95,974 181,033
Responstijd (gem.) 80.22s 16.50s
Responstijd (max) 262.83s 117.26s
Responstijd (totaal) 1363.72s 330.06s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 6.6 10.0 50.0% 0 74.75s 360 9,520
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.88s 330 3,216
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 7.1 9.8 50.0% 0 220.48s 464 34,964
Gemini 3 Flash Preview 7.9 6.4 83.3% 1 95.96s 456 127,964
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 404 29,806
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 22.42s 351 10,485
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 24.27s 246 2,743
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.43s 279 4,893
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 3.0 10.0 0.0% 0 0ms 0 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 15.27s 12 21,684
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 5.1 3.4 33.3% 1 36.65s 213 4,210
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.19s 72 1,905
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 69 2,050
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.04s 72 2,709
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 8.2 7.2 88.9% 1 31.79s 527 5,667
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.05s 183 4,365
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 222 5,235
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 12.60s 234 1,487
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 3.0 10.0 0.0% 0 56.76s 50 1,779
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.50s 11 2,325

Snelle vergelijking

Vergelijkingspaar wisselen