#109

Qwen3.6 27B

Qwen प्रकाशन: 2026-04-20 चाचणी तारीख: 2026-07-16 22:13 qwen/qwen3.6-27b::medium

(medium) (none)

सारांश

Qwen3.6 27B AI BENCHY वर 6.5 स्कोर करते आणि #109 वर आहे. याची reliability 10.0, pass rate 59.1%, एकूण खर्च $0.680, आणि सरासरी response time 106.32s आहे.

Qwen3.6 27B खास का आहे: हे कोडिंग मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #1 आहे; तर डेटा पार्सिंग आणि निष्कर्षण हा सर्वात कमकुवत भाग आहे, rank #13.

स्कोअर

6.5

सुसंगतता

8.0

विश्वसनीयता

10.0

एकूण खर्च (सध्याची किंमत)

$0.680 ↓ -7.1%

या किमतीवर चाचणी केली: $0.732

एकूण आउटपुट टोकन्स

274,192

एकूण इनपुट टोकन्स

106,167

इनपुट किंमत

$0.290 / 1M

आउटपुट किंमत

$2.400 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 12

प्रति प्रयत्न पास दर: 59.1%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

106.32s

प्रतिसाद वेळ (कमाल): 1085.11s

प्रतिसाद वेळ (एकूण): 2339.12s

चुकीचे उत्तर: 6 उत्तर नाही: 3 अवैध टूल कॉल: 2 सूचनांचे पालन केले नाही: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#109 Qwen3.6 27B

medium

खर्च: $0.009
वेळ: 39.6s
टोकन्स: 3,090 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-07-16 22:13 नवीन चाचणी जोडली	6.5	10.0	$0.779 ↑	सध्याची रन
2026-06-04 13:21 नवीन चाचणी जोडली	6.8	10.0	$0.444 ↑	तुलना करा
2026-05-21 23:59 सूट बदलला	6.6	9.9	$0.272	तुलना करा
2026-04-27 21:48 नवीन चाचणी जोडली	7.0	10.0	$0.209	तुलना करा
2026-04-27 21:31 पहिली नोंदलेली रन	7.9	10.0	$0.043	तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रन	स्कोअर	सुसंगतता	विश्वसनीयता	बरोबर चाचण्या	अस्थिर चाचण्या	एकूण आउटपुट टोकन्स	एकूण इनपुट टोकन्स	एकूण खर्च	प्रतिसाद वेळ (सरासरी)
2026-07-16 22:13 · सध्याची रन	6.5	8.0	10.0	10/22	6	274,192	106,167	$0.680	106.32s
2026-04-27 21:31 · पहिली नोंदलेली रन	7.9	8.5	10.0	4/6	1	21,553	0	$0.043	25.56s
फरक	-1.3	-0.5	0.0	+6	+5	+252639	+106167	+$0.638	+80768ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख	इनपुट किंमत	आउटपुट किंमत
2026-06-04 15:40	$0.290 / 1M	$3.200 / 1M
2026-06-10 13:42	$0.290 / 1M	$2.400 / 1M
2026-06-12 18:42	$0.288 / 1M	$3.100 / 1M
2026-06-17 10:07	$0.289 / 1M	$3.170 / 1M
2026-06-29 01:00	$0.260 / 1M	$2.386 / 1M
2026-06-30 21:25	$0.286 / 1M	$2.400 / 1M
2026-07-16 15:36	$0.450 / 1M	$2.700 / 1M
2026-07-24 00:05	$0.600 / 1M	$3.600 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

Qwen3.6 27BmediumvsGemini 3.5 Flash-Litemedium Qwen3.6 27BmediumvsMiMo-V2.5medium Qwen3.6 27BmediumvsQwen3.6 Max Previewnone Qwen3.6 27BmediumvsLaguna XS 2.1mediumमोफत उपलब्ध Qwen3.6 27BmediumvsLongCat 2.0high Qwen3.6 27BmediumvsQwen3.5-27Bnone Qwen3.6 27BmediumvsGLM 5.2none Qwen3.6 27BmediumvsGemini 3.1 Flash Lite Previewlow Qwen3.6 27BmediumvsGemma 4 26B A4Bmediumमोफत उपलब्ध Qwen3.6 27BmediumvsGemini 3.1 Flash Litelow

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	8.3	10.0
कोडिंग	7.7	10.0
संयुक्त	6.7	3.7
डेटा पार्सिंग आणि निष्कर्षण	3.5	1.4
डोमेन-विशिष्ट	2.9	7.2
Samanya Buddhimatta	6.5	3.4
सूचनांचे पालन	10.0	10.0
कोडी सोडवणे	7.7	10.0
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

Qwen3.6 27B

Hamster playing table tennis

#109 Qwen3.6 27B

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स