Navigatie
AI BENCHY
Advertise here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs DeepSeek: DeepSeek V3.2

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-29

Metriek Seed-2.0-Mini Seed-2.0-Mini medium Releasedatum: 2026-02-14 DeepSeek V3.2 DeepSeek V3.2 medium Releasedatum: 2025-12-01
Score 7.1 7.3
Rang #75 #67
Betrouwbaarheid 10.0 10.0
Consistentie 9.2 7.9
Correcte tests
Slaagpercentage per poging 60.0% 67.5%
Instabiele tests 2 5
Totaal runs 60 60
Kosten per resultaat 0.397 0.335
Totale kosten $0.044 $0.037
Invoerprijs $0.100 / 1M $0.252 / 1M
Uitvoerprijs $0.400 / 1M $0.378 / 1M
Uitvoer-tokens 2,555 7,177
Redeneer-tokens 95,974 68,297
Responstijd (gem.) 80.22s 53.34s
Responstijd (max) 262.83s 189.03s
Responstijd (totaal) 1363.72s 1066.71s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 6.6 10.0 50.0% 0 74.75s 360 9,520
DeepSeek V3.2 10.0 10.0 100.0% 0 24.23s 3,247 6,953
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 7.1 9.8 50.0% 0 220.48s 464 34,964
DeepSeek V3.2 4.1 5.8 33.3% 1 184.97s 640 21,230
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 404 29,806
DeepSeek V3.2 10.0 10.0 100.0% 0 93.11s 571 6,296
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 24.27s 246 2,743
DeepSeek V3.2 10.0 10.0 100.0% 0 36.09s 207 7,693
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 3.0 10.0 0.0% 0 0ms 0 0
DeepSeek V3.2 2.9 4.4 22.2% 2 24.27s 21 6,838
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 5.1 3.4 33.3% 1 36.65s 213 4,210
DeepSeek V3.2 5.1 2.5 50.0% 1 58.29s 49 2,189
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 69 2,050
DeepSeek V3.2 10.0 10.0 100.0% 0 35.78s 1,397 2,845
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 8.2 7.2 88.9% 1 31.79s 527 5,667
DeepSeek V3.2 7.0 7.2 55.6% 1 37.69s 518 6,375
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 222 5,235
DeepSeek V3.2 10.0 10.0 100.0% 0 34.81s 507 859
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 3.0 10.0 0.0% 0 56.76s 50 1,779
DeepSeek V3.2 3.0 10.0 0.0% 0 83.99s 20 7,019

Snelle vergelijking

Vergelijkingspaar wisselen