Navigatie
AI BENCHY
Advertise here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs MoonshotAI: Kimi K2.5

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-19

Metriek Seed-2.0-Mini Seed-2.0-Mini medium Releasedatum: 2026-02-14 Kimi K2.5 Kimi K2.5 medium Releasedatum: 2026-01-27
Score 7.2 6.8
Rang #63 #76
Betrouwbaarheid 3.3 10.0
Consistentie 9.2 7.0
Correcte tests
Slaagpercentage per poging 63.2% 68.4%
Instabiele tests 2 7
Totaal runs 57 57
Kosten per resultaat 0.339 2.616
Totale kosten $0.038 $0.236
Invoerprijs $0.100 / 1M $0.400 / 1M
Uitvoerprijs $0.400 / 1M $1.900 / 1M
Uitvoer-tokens 2,469 42,188
Redeneer-tokens 81,017 92,514
Responstijd (gem.) 68.89s 73.39s
Responstijd (max) 262.83s 150.77s
Responstijd (totaal) 1102.23s 880.65s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 6.6 10.0 50.0% 0 74.75s 360 9,520
Kimi K2.5 7.3 5.8 83.3% 2 51.38s 2,789 8,880
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 197.31s 448 20,614
Kimi K2.5 4.7 1.6 66.7% 1 150.77s 1,269 9,749
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 404 29,806
Kimi K2.5 10.0 10.0 100.0% 0 71.37s 703 3,713
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 24.27s 246 2,743
Kimi K2.5 10.0 10.0 100.0% 0 49.78s 563 7,940
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 3.0 10.0 0.0% 0 0ms 0 0
Kimi K2.5 3.5 4.4 33.3% 2 137.29s 20,753 30,564
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 5.1 3.4 33.3% 1 36.65s 213 4,210
Kimi K2.5 6.5 3.4 66.7% 1 69.73s 3,815 4,262
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 69 2,050
Kimi K2.5 10.0 10.0 100.0% 0 92.47s 5,371 6,547
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 8.2 7.2 88.9% 1 25.85s 457 5,060
Kimi K2.5 5.3 7.3 44.4% 1 45.40s 6,671 12,403
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 222 5,235
Kimi K2.5 10.0 10.0 100.0% 0 31.74s 242 812
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Seed-2.0-Mini 3.0 10.0 0.0% 0 56.76s 50 1,779
Kimi K2.5 3.0 10.0 0.0% 0 83.95s 12 7,644

Snelle vergelijking

Vergelijkingspaar wisselen