Navigatie
AI BENCHY
Your ad here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs DeepSeek: DeepSeek V3.2

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-03-12

Metriek Seed-2.0-Lite Seed-2.0-Lite medium Releasedatum: 2026-02-14 DeepSeek V3.2 DeepSeek V3.2 none Releasedatum: 2025-12-01
Rang #3 #37
Gem. score 8.5 5.5
Consistentie 8.7 8.4
Kosten per resultaat 0.870 0.220
Totale kosten $0.105 $0.016
Correcte tests
Slaagpercentage per poging 87.5% 54.2%
Instabiele tests 3 3
Totaal runs 48 48
Uitvoer-tokens 2,815 7,823
Redeneer-tokens 44,618 0
Responstijd (gem.) 29.39s 12.86s
Responstijd (max) 168.71s 115.89s
Responstijd (totaal) 470.29s 205.78s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Gem. score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Gem. score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Lite 10.0 10.0 100.0% 0 23.34s 990 7,037
DeepSeek V3.2 10.0 9.7 0.0% 0 8.79s 1,411 0
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Lite 10.0 10.0 100.0% 0 37.67s 506 4,299
DeepSeek V3.2 8.0 10.0 0.0% 0 115.89s 2,887 0
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Lite 9.9 10.0 100.0% 0 9.07s 246 1,742
DeepSeek V3.2 5.4 5.8 66.7% 1 9.42s 1,710 0
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Lite 4.0 7.2 55.6% 1 88.74s 15 23,897
DeepSeek V3.2 10.0 7.2 22.2% 1 1.61s 24 0
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Lite 7.0 3.6 66.7% 1 18.25s 304 1,620
DeepSeek V3.2 10.0 10.0 100.0% 0 2.86s 67 0
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Lite 10.0 10.0 100.0% 0 7.26s 71 1,480
DeepSeek V3.2 10.0 10.0 100.0% 0 1.52s 66 0
Puzzle Solving Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Lite 9.3 7.9 88.9% 1 11.03s 461 3,532
DeepSeek V3.2 7.7 7.5 88.9% 1 7.37s 1,136 0
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Lite 10.0 10.0 100.0% 0 12.38s 222 1,011
DeepSeek V3.2 10.0 10.0 100.0% 0 11.85s 522 0

Snelle vergelijking

Vergelijkingspaar wisselen