#78

Qwen3.6 27B

Qwen प्रकाशन: 2026-04-20 चाचणी तारीख: 2026-04-27 21:31 qwen/qwen3.6-27b::none

(medium) (none)

सारांश

Qwen3.6 27B AI BENCHY वर 5.9 स्कोर करते आणि #78 वर आहे. याची reliability 10.0, pass rate 54.6%, एकूण खर्च $0.027, आणि सरासरी response time 4.19s आहे.

Qwen3.6 27B खास का आहे: हे कोडिंग मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #1 आहे; तर अँटी-एआय युक्त्या हा सर्वात कमकुवत भाग आहे, rank #13.

स्कोअर

5.9

सुसंगतता

6.9

विश्वसनीयता

10.0

एकूण खर्च (सध्याची किंमत)

$0.027

एकूण आउटपुट टोकन्स

2,924

एकूण इनपुट टोकन्स

इनपुट किंमत

$0.500 / 1M

आउटपुट किंमत

$2.000 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 7

प्रति प्रयत्न पास दर: 54.6%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

4.19s

प्रतिसाद वेळ (कमाल): 10.18s

प्रतिसाद वेळ (एकूण): 46.05s

चुकीचे उत्तर: 5 सूचनांचे पालन केले नाही: 1 अवैध टूल कॉल: 1

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#78 Qwen3.6 27B

none

Cost: $0.009
Time: 83.0s
Tokens: 4,549 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-06-04 13:16 नवीन चाचणी जोडली	5.6	10.0	$0.028 ↓	तुलना करा
2026-05-21 23:48 सूट बदलला	5.8	10.0	$0.032	तुलना करा
2026-04-27 21:46 नवीन चाचणी जोडली	6.0	10.0	$0.031	तुलना करा
2026-04-27 21:31 पहिली नोंदलेली रन	5.9	10.0	$0.027	सध्याची रन

रन तुलना

रन	स्कोअर	सुसंगतता	विश्वसनीयता	बरोबर चाचण्या	अस्थिर चाचण्या	एकूण आउटपुट टोकन्स	एकूण खर्च	प्रतिसाद वेळ (सरासरी)
2026-04-27 21:31 · पहिली नोंदलेली रन	5.9	6.9	10.0	4/11	4	2,924	$0.027	4.19s
2026-04-27 21:46 · नवीन चाचणी जोडली	6.0	7.2	10.0	7/18	6	3,775	$0.031	4.00s
फरक	-0.1	-0.3	0.0	-3	-2	-851	-$0.004	+186ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

Qwen3.6 27BnonevsQwen3.5 Plus 2026-02-15none Qwen3.6 27BnonevsGemini 2.5 Flashnone Qwen3.6 27BnonevsGPT-5 Nanomedium Qwen3.6 27BnonevsGLM 5none Qwen3.6 27Bnonevsgpt-oss-120bmediumमोफत उपलब्ध Qwen3.6 27BnonevsGemini 3 Flash Previewmedium Qwen3.6 27BnonevsGemini 3.5 Flashhigh Qwen3.6 27BnonevsNemotron 3 Ultra 550b A55bmediumमोफत उपलब्ध Qwen3.6 27BnonevsGemini 3.5 Flashlow

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	4.0	1.6
कोडिंग	10.0	10.0
संयुक्त	3.0	10.0
डेटा पार्सिंग आणि निष्कर्षण	9.9	10.0
डोमेन-विशिष्ट	6.5	10.0
Samanya Buddhimatta	5.2	9.9
सूचनांचे पालन	2.8	1.6
टूल कॉलिंग	9.5	10.0

Qwen3.6 27B

Hamster playing table tennis

#78 Qwen3.6 27B

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स