#35

Qwen3.6 Plus

Qwen रिलीज़: 2026-04-20 परीक्षण किया गया: 2026-05-22 00:01 qwen/qwen3.6-plus::medium

सारांश

Qwen3.6 Plus AI BENCHY पर 7.8 स्कोर करता है और #35 पर है। इसकी reliability 10.0, pass rate 68.3%, कुल लागत $0.082, और औसत response time 26.78s है।

पहचान नोट

Qwen3.6 Plus Preview, Qwen3.6 Plus का प्रीव्यू संस्करण था।

स्कोर

7.8

संगति

9.2

विश्वसनीयता

10.0

कुल लागत (वर्तमान कीमत)

$0.082

कुल आउटपुट टोकन

126,760

कुल इनपुट टोकन

इनपुट कीमत

$0.325 / 1M

आउटपुट कीमत

$1.950 / 1M

सही परीक्षण

गलत टेस्ट: 7

प्रति प्रयास पास दर: 68.3%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

26.78s

प्रतिक्रिया समय (अधिकतम): 201.68s

प्रतिक्रिया समय (कुल): 508.74s

गलत उत्तर: 5 API त्रुटि: 1 निर्देशों का पालन नहीं किया: 1

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#35 Qwen3.6 Plus

medium

लागत: $0.024
समय: 219.0s
टोकन: 12,235 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-06-04 13:30 नया टेस्ट जोड़ा गया	7.9	10.0	$0.294 ↑	तुलना करें
2026-05-22 00:01 दोबारा परीक्षण	7.8	10.0	$0.082	वर्तमान रन
2026-04-11 01:44 पहला दर्ज रन	8.1	लागू नहीं	$0.000	तुलना करें

रन तुलना

रन	स्कोर	संगति	विश्वसनीयता	सही परीक्षण	अस्थिर टेस्ट	कुल आउटपुट टोकन	कुल लागत	प्रतिक्रिया समय (औसत)
2026-05-22 00:01 · दोबारा परीक्षण	7.8	9.2	10.0	13/20	2	126,760	$0.082	26.78s
2026-04-11 01:44 · पहला दर्ज रन	8.1	9.5	लागू नहीं	13/18	1	85,545	$0.000	15.27s
अंतर	-0.4	-0.3		0	+1	+41215	+$0.082	+11508ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

Qwen3.6 PlusmediumvsQwen3.5-27Bmedium Qwen3.6 PlusmediumvsQwen3.5 Plus 2026-02-15medium Qwen3.6 PlusmediumvsClaude Sonnet 4.6medium Qwen3.6 PlusmediumvsGPT-5.4 Minimedium Qwen3.6 PlusmediumvsGemini 3.1 Flash Lite Previewmedium Qwen3.6 PlusmediumvsGemini 3.5 Flashhigh Qwen3.6 PlusmediumvsGemini 3 Flash Previewmedium Qwen3.6 PlusmediumvsNemotron 3 Ultra 550b A55bmediumनिःशुल्क उपलब्ध Qwen3.6 PlusmediumvsGPT-5.5low

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	10.0	10.0
कोडिंग	4.1	6.7
संयुक्त	10.0	10.0
डेटा पार्सिंग और निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	2.9	7.2
Samanya Buddhimatta	5.1	10.0
निर्देश पालन	10.0	10.0
पहेली समाधान	10.0	10.0
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

Qwen3.6 Plus

Hamster playing table tennis

#35 Qwen3.6 Plus

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल