AI BENCHY
Compară Grafice
❤️ XCS
Your ad here

#29

Qwen: Qwen3.5-27B

Qwen · qwen/qwen3.5-27b::none

Deschide selectorul de comparație modele

Scor mediu

4.70

Cost per rezultat

0.190

Consistență

9.94

Cost total

$0.010

Teste corecte

5/14

Un test este considerat trecut complet doar dacă toate rulările lui trec.

Teste greșite

9

Rată de trecere pe încercare: 35.7%

Teste instabile

0

Timp de răspuns: medie 1.14s · total 16.01s · maxim 3.54s

Răspuns greșit: 7 Nu a urmat instrucțiunile: 2

Top modele după scor

Alege primul model, apoi fă clic pe al doilea model pentru a deschide o pagină alăturată.

Defalcare pe categorii

Categorie Scor mediu Consistență Teste corecte
Anti-AI Tricks 4.00 10.00 1/3
Data parsing and extraction 9.88 10.00 2/2
Domain specific 1.00 10.00 0/3
Instructions following 4.00 10.00 0/2
Puzzle Solving 4.34 9.68 1/3
Tool Calling 10.00 10.00 1/1