#37

Qwen3.6 27B

Qwen Releasedatum: 2026-04-20 Getest op: 2026-04-27 21:31 qwen/qwen3.6-27b::medium

(medium) (none)

Samenvatting

Qwen3.6 27B scoort 7.9 op AI BENCHY en staat op #37. Het model heeft 10.0 betrouwbaarheid, een slagingspercentage van 77.8%, $0.043 totale kosten en 25.56s gemiddelde responstijd.

Wat Qwen3.6 27B uniek maakt: De totale benchmarkkosten zijn ongewoon laag voor dit scoreniveau.

Score

7.9

Consistentie

8.5

Betrouwbaarheid

10.0

Totale kosten (huidige prijs)

$0.043

Totaal aantal uitvoer-tokens

21,553

Totaal aantal invoer-tokens

Invoerprijs

$0.500 / 1M

Uitvoerprijs

$2.000 / 1M

Correcte tests

Foute tests: 2

Slaagpercentage per poging: 77.8%

Instabiele tests

Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).

Responstijd (gem.)

25.56s

Responstijd (max): 47.48s

Responstijd (totaal): 153.33s

Geen antwoord: 1 Verkeerd antwoord: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#37 Qwen3.6 27B

medium

Kosten: $0.009
Tijd: 39.6s
Tokens: 3,090 tok

Rungeschiedenis

Getest op	Score	Betrouwbaarheid	Totale kosten	Vergelijken
2026-07-16 22:13 Nieuwe test toegevoegd	6.5	10.0	$0.779 ↑	Vergelijken
2026-06-04 13:21 Nieuwe test toegevoegd	6.8	10.0	$0.444 ↑	Vergelijken
2026-05-21 23:59 Suite gewijzigd	6.6	9.9	$0.272	Vergelijken
2026-04-27 21:48 Nieuwe test toegevoegd	7.0	10.0	$0.209	Vergelijken
2026-04-27 21:31 Eerste geregistreerde run	7.9	10.0	$0.043	Huidige run

Runvergelijking

Run	Score	Consistentie	Betrouwbaarheid	Correcte tests	Instabiele tests	Totaal aantal uitvoer-tokens	Totaal aantal invoer-tokens	Totale kosten	Responstijd (gem.)
2026-04-27 21:31 · Eerste geregistreerde run	7.9	8.5	10.0	4/6	1	21,553	0	$0.043	25.56s
2026-06-04 13:21 · Nieuwe test toegevoegd	6.8	8.2	10.0	10/21	5	138,710	39,376	$0.444	59.71s
Verschil	+1.1	+0.3	0.0	-6	-4	-117157	-39376	-$0.401	-34159ms