AI BENCHY
Your ad here

#3

Seed-2.0-Lite

Bytedance Seed · Lansare: 2026-02-14 · bytedance-seed/seed-2.0-lite::medium

Cost per rezultat

0.870

Consistență

8.7

Cost total

$0.105

Teste corecte

Teste greșite: 4

Rată de trecere pe încercare: 87.5%

Teste instabile

3

Testele instabile au avut rezultate mixte între rulări (cel puțin un succes și un eșec).

Timp de răspuns (mediu)

29.39s

Timp de răspuns (maxim): 168.71s

Timp de răspuns (total): 470.29s

Grafice

Alege primul model, apoi fă clic pe al doilea model pentru a deschide o pagină alăturată.

Total tokenuri de ieșire

Scor mediu vs Total tokenuri de ieșire

Comparație rapidă

Defalcare pe categorii

Categorie Scor mediu Consistență Teste corecte
Trucuri anti-AI 10.0 10.0
Combinat 10.0 10.0
Parsare și extragere de date 9.9 10.0
Specific domeniului 4.0 7.2
Inteligență generală 7.0 3.6
Respectarea instrucțiunilor 10.0 10.0
Rezolvare de puzzle-uri 9.3 7.9
Apelare instrumente 10.0 10.0

Modele comparate