#20

Qwen3.5 Plus 2026-02-15

Qwen Releasedatum: 2026-02-15 Getest op: 2026-05-21 14:32 qwen/qwen3.5-plus-02-15::medium

(medium) (none)

Score

8.0

Consistentie

9.1

Betrouwbaarheid

10.0

Totale kosten

$0.325

Totaal aantal uitvoer-tokens

180,752

Invoerprijs

$0.260 / 1M

Uitvoerprijs

$1.560 / 1M

Correcte tests

Foute tests: 6

Slaagpercentage per poging: 75.0%

Instabiele tests

Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).

Responstijd (gem.)

71.00s

Responstijd (max): 307.01s

Responstijd (totaal): 923.02s

Verkeerd antwoord: 3 Time-out: 2 Instructies niet gevolgd: 1

Rungeschiedenis

Getest op	Score	Betrouwbaarheid	Totale kosten	Vergelijken
2026-05-21 14:32 Suite gewijzigd	8.4	10.0	$0.325	Vergelijken
2026-05-21 14:32 Suite gewijzigd	8.0	10.0	$0.325	Huidige run
2026-04-11 01:44 Eerste geregistreerde run	8.5	n.v.t.	$0.220	Vergelijken

Deze run gebruikte een andere benchmarkset. Houd rekening met suitewijzigingen bij het lezen van historische verschuivingen.

Grafieken

Kies eerst het eerste model en klik daarna op een tweede model om een zij-aan-zijpagina te openen.

Topmodellen op score

Score vs Totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Snelle vergelijking

Qwen3.5 Plus 2026-02-15mediumvsMiMo-V2.5-Promedium Qwen3.5 Plus 2026-02-15mediumvsGPT-5.3-Codexmedium Qwen3.5 Plus 2026-02-15mediumvsQwen3.6 Max Previewmedium Qwen3.5 Plus 2026-02-15mediumvsSeed-2.0-Litemedium Qwen3.5 Plus 2026-02-15mediumvsGemini 3 Flash Previewmedium Qwen3.5 Plus 2026-02-15mediumvsGemini 3.5 Flashlow Qwen3.5 Plus 2026-02-15mediumvsRing-2.6-1Tmedium

Categorie-uitsplitsing

Categorie	Score	Consistentie
Anti-AI-trucs	8.2	7.9
Programmeren	7.2	9.8
Gecombineerd	10.0	10.0
Gegevensparsering en extractie	10.0	10.0
Domeinspecifiek	5.3	10.0
Algemene intelligentie	4.7	1.6
Instructies opvolgen	10.0	10.0
Puzzeloplossing	10.0	10.0
Toolaanroepen	10.0	10.0
Algemene kennis	3.0	10.0

Qwen3.5 Plus 2026-02-15

Grafieken

Topmodellen op score

Score vs Totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Snelle vergelijking

Categorie-uitsplitsing

Vergeleken modellen