AI BENCHY
AD
Track all your projects in one dashboard. Get ๐Ÿ“Šstats, ๐Ÿ”ฅheatmaps and ๐Ÿ‘€recordings in one self-hosted dashboard.
uxwizz.com

#45

Seed-2.0-Lite

Bytedance Seed ยท Releasedatum: 2026-02-14 ยท bytedance-seed/seed-2.0-lite::none

Gem. score

4.9

Kosten per resultaat

0.214

Consistentie

7.4

Totale kosten

$0.015

Correcte tests

Foute tests: 9

Slaagpercentage per poging: 56.3%

Instabiele tests

5

Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).

Responstijd (gem.)

2.49s

Responstijd (max): 6.70s

Responstijd (totaal): 39.91s

Grafieken

Kies eerst het eerste model en klik daarna op een tweede model om een zij-aan-zijpagina te openen.

Totaal aantal uitvoer-tokens

Gem. score vs Totaal aantal uitvoer-tokens

Snelle vergelijking

Categorie-uitsplitsing

Categorie Gem. score Consistentie Correcte tests
Anti-AI-trucs 10.0 4.6
Gecombineerd 10.0 10.0
Gegevensparsering en extractie 9.9 10.0
Domeinspecifiek 10.0 7.2
Algemene intelligentie 10.0 10.0
Instructies opvolgen 10.0 10.0
Puzzeloplossing 4.0 4.4
Toolaanroepen 10.0 10.0

Vergeleken modellen