Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs Qwen: Qwen3.5-35B-A3B

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-04-14

Metriek Seed-2.0-Mini Seed-2.0-Mini medium Releasedatum: 2026-02-14 Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Releasedatum: 2026-02-24
Score 7.5 7.4
Rang #36 #40
Consistentie 9.2 6.7
Correcte tests
Slaagpercentage per poging 66.7% 79.6%
Instabiele tests 2 7
Totaal runs 54 54
Kosten per resultaat 0.333 3.976
Totale kosten $0.037 $0.398
Invoerprijs $0.100 / 1M $0.163 / 1M
Uitvoerprijs $0.400 / 1M $1.300 / 1M
Uitvoer-tokens 2,419 10,137
Redeneer-tokens 79,238 208,761
Responstijd (gem.) 69.70s 44.51s
Responstijd (max) 262.83s 106.00s
Responstijd (totaal) 1045.47s 801.21s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 6.6 10.0 50.0% 0 74.75s 360 9,520
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 21.13s 798 42,652
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 197.31s 448 20,614
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 79.09s 4,273 33,078
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 404 29,806
Qwen3.5-35B-A3B 4.7 1.6 66.7% 1 75.34s 775 12,485
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 24.27s 246 2,743
Qwen3.5-35B-A3B 7.3 5.9 83.3% 1 59.33s 235 19,493
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 3.0 10.0 0.0% 0 0ms 0 0
Qwen3.5-35B-A3B 4.1 4.4 44.5% 2 88.34s 41 46,368
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 5.1 3.4 33.3% 1 36.65s 213 4,210
Qwen3.5-35B-A3B 2.8 1.6 33.3% 1 30.30s 20 3,753
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 69 2,050
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 24.45s 97 17,361
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 8.2 7.2 88.9% 1 25.85s 457 5,060
Qwen3.5-35B-A3B 6.4 4.4 77.8% 2 31.58s 3,589 32,206
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 222 5,235
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 4.65s 309 1,365

Snelle vergelijking

Vergelijkingspaar wisselen