Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs Google: Gemini 3.5 Flash

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-29

Metriek Seed-2.0-Mini Seed-2.0-Mini medium Releasedatum: 2026-02-14 Gemini 3.5 Flash Gemini 3.5 Flash high Releasedatum: 2026-05-19
Score 7.1 9.6
Rang #75 #2
Betrouwbaarheid 10.0 10.0
Consistentie 9.2 9.6
Correcte tests
Slaagpercentage per poging 60.0% 96.7%
Instabiele tests 2 1
Totaal runs 60 60
Kosten per resultaat 0.397 5.231
Totale kosten $0.044 $0.994
Invoerprijs $0.100 / 1M $1.500 / 1M
Uitvoerprijs $0.400 / 1M $9.000 / 1M
Uitvoer-tokens 2,555 1,969
Redeneer-tokens 95,974 102,679
Responstijd (gem.) 80.22s 8.30s
Responstijd (max) 262.83s 34.82s
Responstijd (totaal) 1363.72s 165.92s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 6.6 10.0 50.0% 0 74.75s 360 9,520
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.57s 174 4,997
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 7.1 9.8 50.0% 0 220.48s 464 34,964
Gemini 3.5 Flash 10.0 10.0 100.0% 0 24.62s 450 34,170
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 404 29,806
Gemini 3.5 Flash 10.0 10.0 100.0% 0 22.37s 351 16,323
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 24.27s 246 2,743
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.43s 279 8,466
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 3.0 10.0 0.0% 0 0ms 0 0
Gemini 3.5 Flash 7.6 7.2 77.8% 1 14.09s 12 24,721
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 5.1 3.4 33.3% 1 36.65s 213 4,210
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.63s 115 1,650
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 69 2,050
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.35s 70 3,799
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 8.2 7.2 88.9% 1 31.79s 527 5,667
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.23s 241 4,940
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 222 5,235
Gemini 3.5 Flash 9.8 10.0 100.0% 0 4.96s 265 1,608
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 3.0 10.0 0.0% 0 56.76s 50 1,779
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.94s 12 2,005

Snelle vergelijking

Vergelijkingspaar wisselen