Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Gemini 3 PRO Preview

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-01

Metriek Seed-2.0-Lite Seed-2.0-Lite medium Releasedatum: 2026-02-14 Gemini 3 PRO Preview Gemini 3 PRO Preview medium Releasedatum: 2025-11-18
Score 8.6 8.4
Rang #12 #17
Betrouwbaarheid n.v.t. n.v.t.
Consistentie 8.8 10.0
Correcte tests
Slaagpercentage per poging 83.3% 77.8%
Instabiele tests 3 0
Totaal runs 54 54
Kosten per resultaat 0.926 1.406
Totale kosten $0.121 $0.197
Invoerprijs $0.250 / 1M $0.000 / 1M
Uitvoerprijs $2.000 / 1M $0.000 / 1M
Uitvoer-tokens 3,257 1,508
Redeneer-tokens 52,042 10,084
Responstijd (gem.) 30.37s 9.06s
Responstijd (max) 168.71s 26.24s
Responstijd (totaal) 546.72s 90.58s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Lite 8.3 10.0 75.0% 0 17.99s 996 7,142
Gemini 3 PRO Preview 10.0 10.0 100.0% 0 14.99s 149 1,485
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Lite 10.0 10.0 100.0% 0 74.49s 436 7,319
Gemini 3 PRO Preview 3.0 10.0 0.0% 0 0ms 0 0
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Lite 10.0 10.0 100.0% 0 37.67s 506 4,299
Gemini 3 PRO Preview 3.0 10.0 0.0% 0 10.37s 351 952
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Lite 10.0 10.0 100.0% 0 9.07s 246 1,742
Gemini 3 PRO Preview 10.0 10.0 100.0% 0 10.84s 279 3,156
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Lite 5.9 7.2 55.6% 1 88.74s 15 23,897
Gemini 3 PRO Preview 5.3 10.0 33.3% 0 7.01s 15 1,195
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Lite 6.7 3.6 66.7% 1 18.25s 304 1,620
Gemini 3 PRO Preview 10.0 10.0 100.0% 0 9.34s 78 374
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Lite 10.0 10.0 100.0% 0 7.26s 71 1,480
Gemini 3 PRO Preview 9.8 10.0 100.0% 0 3.26s 69 754
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Lite 9.0 7.9 88.9% 1 11.03s 461 3,532
Gemini 3 PRO Preview 10.0 10.0 100.0% 0 3.91s 243 1,197
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Lite 10.0 10.0 100.0% 0 12.38s 222 1,011
Gemini 3 PRO Preview 10.0 10.0 100.0% 0 11.96s 324 971

Snelle vergelijking

Vergelijkingspaar wisselen