#164

Qwen3.6 27B

Qwen प्रकाशन: 2026-04-20 चाचणी तारीख: 2026-07-16 21:24 qwen/qwen3.6-27b::none

(medium) (none)

सारांश

Qwen3.6 27B AI BENCHY वर 5.5 स्कोर करते आणि #164 वर आहे. याची reliability 10.0, pass rate 45.5%, एकूण खर्च $0.067, आणि सरासरी response time 10.65s आहे.

Qwen3.6 27B खास का आहे: हे कोडिंग मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #1 आहे; तर टूल कॉलिंग हा सर्वात कमकुवत भाग आहे, rank #11.

स्कोअर

5.5

सुसंगतता

7.6

विश्वसनीयता

10.0

एकूण खर्च (सध्याची किंमत)

$0.067 ↓ -22.1%

या किमतीवर चाचणी केली: $0.086

एकूण आउटपुट टोकन्स

16,155

एकूण इनपुट टोकन्स

95,796

इनपुट किंमत

$0.290 / 1M

आउटपुट किंमत

$2.400 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 15

प्रति प्रयत्न पास दर: 45.5%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

10.65s

प्रतिसाद वेळ (कमाल): 156.31s

प्रतिसाद वेळ (एकूण): 234.39s

चुकीचे उत्तर: 11 सूचनांचे पालन केले नाही: 2 अवैध टूल कॉल: 2

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#164 Qwen3.6 27B

none

खर्च: $0.009
वेळ: 83.0s
टोकन्स: 4,549 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-07-16 21:24 नवीन चाचणी जोडली	5.5	10.0	$0.087 ↑	सध्याची रन
2026-06-04 13:16 नवीन चाचणी जोडली	5.6	10.0	$0.028 ↓	तुलना करा
2026-05-21 23:48 सूट बदलला	5.8	10.0	$0.032	तुलना करा
2026-04-27 21:46 नवीन चाचणी जोडली	6.0	10.0	$0.031	तुलना करा
2026-04-27 21:31 पहिली नोंदलेली रन	5.9	10.0	$0.027	तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रन	स्कोअर	सुसंगतता	विश्वसनीयता	बरोबर चाचण्या	अस्थिर चाचण्या	एकूण आउटपुट टोकन्स	एकूण इनपुट टोकन्स	एकूण खर्च	प्रतिसाद वेळ (सरासरी)
2026-07-16 21:24 · सध्याची रन	5.5	7.6	10.0	7/22	6	16,155	95,796	$0.067	10.65s
2026-04-27 21:31 · पहिली नोंदलेली रन	5.9	6.9	10.0	4/11	4	2,924	0	$0.027	4.19s
फरक	-0.4	+0.7	0.0	+3	+2	+13231	+95796	+$0.040	+6468ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख	इनपुट किंमत	आउटपुट किंमत
2026-06-04 15:40	$0.290 / 1M	$3.200 / 1M
2026-06-10 13:42	$0.290 / 1M	$2.400 / 1M
2026-06-12 18:42	$0.288 / 1M	$3.100 / 1M
2026-06-17 10:07	$0.289 / 1M	$3.170 / 1M
2026-06-29 01:00	$0.260 / 1M	$2.386 / 1M
2026-06-30 21:25	$0.286 / 1M	$2.400 / 1M
2026-07-16 15:36	$0.450 / 1M	$2.700 / 1M
2026-07-24 00:05	$0.600 / 1M	$3.600 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

Qwen3.6 27BnonevsGLM 5.1none Qwen3.6 27BnonevsMiMo-V2.5-Pronone Qwen3.6 27BnonevsDeepSeek V4 Flashnone Qwen3.6 27BnonevsKimi K2.5none Qwen3.6 27BnonevsKAT-Coder-Air V2.5medium Qwen3.6 27BnonevsGemma 4 26B A4Bnoneमोफत उपलब्ध Qwen3.6 27BnonevsKAT-Coder-Air V2.5high Qwen3.6 27BnonevsLaguna S 2.1mediumमोफत उपलब्ध Qwen3.6 27BnonevsQwen3.5-122B-A10Bnone Qwen3.6 27BnonevsKAT-Coder-Air V2.5low

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	3.8	3.7
कोडिंग	5.5	10.0
संयुक्त	3.2	9.1
डेटा पार्सिंग आणि निष्कर्षण	7.3	5.8
डोमेन-विशिष्ट	7.7	10.0
Samanya Buddhimatta	5.2	9.9
सूचनांचे पालन	6.2	5.8
कोडी सोडवणे	5.3	7.2
टूल कॉलिंग	9.5	10.0
सामान्य ज्ञान	3.0	10.0

Qwen3.6 27B

Hamster playing table tennis

#164 Qwen3.6 27B

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स