AI BENCHY
Compară Grafice
❤️ XCS
Your ad here

#5

Qwen: Qwen3.5-27B

Qwen · qwen/qwen3.5-27b::medium

Deschide selectorul de comparație modele

Scor mediu

8.56

Cost per rezultat

2.950

Consistență

9.56

Cost total

$0.325

Teste corecte

11/14

Un test este considerat trecut complet doar dacă toate rulările lui trec.

Teste greșite

3

Rată de trecere pe încercare: 83.3%

Teste instabile

1

Timp de răspuns: medie 33.79s · total 473.12s · maxim 95.52s

Nu a urmat instrucțiunile: 1 Timp expirat: 1 Răspuns greșit: 1

Top modele după scor

Alege primul model, apoi fă clic pe al doilea model pentru a deschide o pagină alăturată.

Defalcare pe categorii

Categorie Scor mediu Consistență Teste corecte
Anti-AI Tricks 10.00 10.00 3/3
Data parsing and extraction 9.88 10.00 2/2
Domain specific 4.00 10.00 1/3
Instructions following 9.00 6.88 1/2
Puzzle Solving 10.00 10.00 3/3
Tool Calling 10.00 10.00 1/1