AI BENCHY
Your ad here

#60

Qwen3.5-9B

Qwen ยท Releasedatum: 2026-03-02 ยท qwen/qwen3.5-9b::none

Gem. score

3.4

Kosten per resultaat

0.111

Consistentie

10.0

Totale kosten

$0.005

Correcte tests

Foute tests: 12

Slaagpercentage per poging: 25.0%

Instabiele tests

0

Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).

Responstijd (gem.)

1.06s

Responstijd (max): 5.91s

Responstijd (totaal): 16.95s

Grafieken

Kies eerst het eerste model en klik daarna op een tweede model om een zij-aan-zijpagina te openen.

Totaal aantal uitvoer-tokens

Gem. score vs Totaal aantal uitvoer-tokens

Snelle vergelijking

Categorie-uitsplitsing

Categorie Gem. score Consistentie Correcte tests
Anti-AI-trucs 10.0 9.9
Gecombineerd 10.0 10.0
Gegevensparsering en extractie 9.9 10.0
Domeinspecifiek 10.0 10.0
Algemene intelligentie 3.0 9.9
Instructies opvolgen 5.5 10.0
Puzzeloplossing 10.0 9.9
Toolaanroepen 10.0 10.0

Vergeleken modellen