AI BENCHY
Your ad here

#66

Qwen3.5-9B

Qwen ยท Releasedatum: 2026-03-02 ยท qwen/qwen3.5-9b::medium

Gem. score

2.6

Kosten per resultaat

0.779

Consistentie

7.4

Totale kosten

$0.024

Correcte tests

Foute tests: 13

Slaagpercentage per poging: 35.4%

Instabiele tests

5

Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).

Responstijd (gem.)

71.44s

Responstijd (max): 226.38s

Responstijd (totaal): 928.77s

Grafieken

Kies eerst het eerste model en klik daarna op een tweede model om een zij-aan-zijpagina te openen.

Totaal aantal uitvoer-tokens

Gem. score vs Totaal aantal uitvoer-tokens

Snelle vergelijking

Categorie-uitsplitsing

Categorie Gem. score Consistentie Correcte tests
Anti-AI-trucs 4.0 7.2
Gecombineerd 10.0 10.0
Gegevensparsering en extractie 5.0 5.6
Domeinspecifiek 10.0 7.2
Algemene intelligentie 10.0 1.6
Instructies opvolgen 5.5 5.8
Puzzeloplossing 10.0 10.0
Toolaanroepen 10.0 10.0

Vergeleken modellen