#109

Qwen3.6 27B

Qwen रिलीज़: 2026-04-20 परीक्षण किया गया: 2026-07-16 22:13 qwen/qwen3.6-27b::medium

(medium) (none)

सारांश

Qwen3.6 27B AI BENCHY पर 6.5 स्कोर करता है और #109 पर है। इसकी reliability 10.0, pass rate 59.1%, कुल लागत $0.680, और औसत response time 106.32s है।

Qwen3.6 27B को अलग क्या बनाता है: यह कोडिंग में सबसे अलग दिखता है, जहाँ इसकी रैंक #1 है; जबकि डेटा पार्सिंग और निष्कर्षण इसकी सबसे कमजोर जगह है, जहाँ यह #13 पर है।

स्कोर

6.5

संगति

8.0

विश्वसनीयता

10.0

कुल लागत (वर्तमान कीमत)

$0.680 ↓ -7.1%

परीक्षण के समय: $0.732

कुल आउटपुट टोकन

274,192

कुल इनपुट टोकन

106,167

इनपुट कीमत

$0.290 / 1M

आउटपुट कीमत

$2.400 / 1M

सही परीक्षण

गलत टेस्ट: 12

प्रति प्रयास पास दर: 59.1%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

106.32s

प्रतिक्रिया समय (अधिकतम): 1085.11s

प्रतिक्रिया समय (कुल): 2339.12s

गलत उत्तर: 6 कोई उत्तर नहीं: 3 अमान्य टूल कॉल: 2 निर्देशों का पालन नहीं किया: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#109 Qwen3.6 27B

medium

लागत: $0.009
समय: 39.6s
टोकन: 3,090 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-07-16 22:13 नया टेस्ट जोड़ा गया	6.5	10.0	$0.779 ↑	वर्तमान रन
2026-06-04 13:21 नया टेस्ट जोड़ा गया	6.8	10.0	$0.444 ↑	तुलना करें
2026-05-21 23:59 सूट बदला गया	6.6	9.9	$0.272	तुलना करें
2026-04-27 21:48 नया टेस्ट जोड़ा गया	7.0	10.0	$0.209	तुलना करें
2026-04-27 21:31 पहला दर्ज रन	7.9	10.0	$0.043	तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

रन तुलना

रन	स्कोर	संगति	विश्वसनीयता	सही परीक्षण	अस्थिर टेस्ट	कुल आउटपुट टोकन	कुल इनपुट टोकन	कुल लागत	प्रतिक्रिया समय (औसत)
2026-07-16 22:13 · वर्तमान रन	6.5	8.0	10.0	10/22	6	274,192	106,167	$0.680	106.32s
2026-04-27 21:31 · पहला दर्ज रन	7.9	8.5	10.0	4/6	1	21,553	0	$0.043	25.56s
अंतर	-1.3	-0.5	0.0	+6	+5	+252639	+106167	+$0.638	+80768ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख	इनपुट कीमत	आउटपुट कीमत
2026-06-04 15:40	$0.290 / 1M	$3.200 / 1M
2026-06-10 13:42	$0.290 / 1M	$2.400 / 1M
2026-06-12 18:42	$0.288 / 1M	$3.100 / 1M
2026-06-17 10:07	$0.289 / 1M	$3.170 / 1M
2026-06-29 01:00	$0.260 / 1M	$2.386 / 1M
2026-06-30 21:25	$0.286 / 1M	$2.400 / 1M
2026-07-16 15:36	$0.450 / 1M	$2.700 / 1M
2026-07-24 00:05	$0.600 / 1M	$3.600 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

Qwen3.6 27BmediumvsGemini 3.5 Flash-Litemedium Qwen3.6 27BmediumvsMiMo-V2.5medium Qwen3.6 27BmediumvsQwen3.6 Max Previewnone Qwen3.6 27BmediumvsLaguna XS 2.1mediumनिःशुल्क उपलब्ध Qwen3.6 27BmediumvsLongCat 2.0high Qwen3.6 27BmediumvsQwen3.5-27Bnone Qwen3.6 27BmediumvsGLM 5.2none Qwen3.6 27BmediumvsGemini 3.1 Flash Lite Previewlow Qwen3.6 27BmediumvsGemma 4 26B A4Bmediumनिःशुल्क उपलब्ध Qwen3.6 27BmediumvsGemini 3.1 Flash Litelow

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	8.3	10.0
कोडिंग	7.7	10.0
संयुक्त	6.7	3.7
डेटा पार्सिंग और निष्कर्षण	3.5	1.4
डोमेन-विशिष्ट	2.9	7.2
Samanya Buddhimatta	6.5	3.4
निर्देश पालन	10.0	10.0
पहेली समाधान	7.7	10.0
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

Qwen3.6 27B

Hamster playing table tennis

#109 Qwen3.6 27B

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल