AI BENCHY
Compară Grafice
❤️ Made by XCS
Your ad here

#18

Seed-2.0-Mini

Bytedance Seed · bytedance-seed/seed-2.0-mini::medium

Scor mediu

6.13

Cost per rezultat

0.177

Consistență

8.91

Cost total

$0.013

Teste corecte

7

Un test este considerat trecut complet doar dacă toate rulările lui trec.

Teste greșite

7

Rată de trecere pe încercare: 59.5%

Teste instabile

2

Timp de răspuns: medie 51.69s · total 568.63s · maxim 182.10s

Timp expirat: 4 Nu a urmat instrucțiunile: 2 Răspuns greșit: 1

Top modele după scor

Alege primul model, apoi fă clic pe al doilea model pentru a deschide o pagină alăturată.

Comparație rapidă

Defalcare pe categorii

Categorie Scor mediu Consistență Teste corecte
Anti-AI Tricks 7.00 10.00 2/3
Data parsing and extraction 9.88 10.00 2/2
Domain specific 1.00 10.00 0/3
Instructions following 8.00 9.99 1/2
Puzzle Solving 5.34 4.91 1/3
Tool Calling 10.00 10.00 1/1