#21

Qwen3.6 Plus

Qwen रिलीज़: 2026-04-20 परीक्षण किया गया: 2026-04-11 01:44 qwen/qwen3.6-plus::medium

सारांश

Qwen3.6 Plus AI BENCHY पर 8.1 स्कोर करता है और #21 पर है। इसकी reliability लागू नहीं, pass rate 74.1%, कुल लागत $0.000, और औसत response time 15.27s है।

Qwen3.6 Plus को अलग क्या बनाता है: यह एंटी-एआई ट्रिक्स में सबसे अलग दिखता है, जहाँ इसकी रैंक #1 है; जबकि कोडिंग इसकी सबसे कमजोर जगह है, जहाँ यह #17 पर है। इस score range के लिए इसकी कुल benchmark लागत असामान्य रूप से कम है।

पहचान नोट

Qwen3.6 Plus Preview, Qwen3.6 Plus का प्रीव्यू संस्करण था।

स्कोर

8.1

संगति

9.5

विश्वसनीयता

लागू नहीं

कुल लागत (वर्तमान कीमत)

$0.000

कुल आउटपुट टोकन

85,545

कुल इनपुट टोकन

इनपुट कीमत

$0.325 / 1M

आउटपुट कीमत

$1.950 / 1M

सही परीक्षण

गलत टेस्ट: 5

प्रति प्रयास पास दर: 74.1%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

15.27s

प्रतिक्रिया समय (अधिकतम): 43.55s

प्रतिक्रिया समय (कुल): 259.55s

गलत उत्तर: 3 API त्रुटि: 1 निर्देशों का पालन नहीं किया: 1

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#21 Qwen3.6 Plus

medium

लागत: $0.024
समय: 219.0s
टोकन: 12,235 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-06-04 13:30 नया टेस्ट जोड़ा गया	7.9	10.0	$0.294 ↑	तुलना करें
2026-05-22 00:01 दोबारा परीक्षण	7.8	10.0	$0.082	तुलना करें
2026-04-11 01:44 पहला दर्ज रन	8.1	लागू नहीं	$0.000	वर्तमान रन

रन तुलना

रन	स्कोर	संगति	विश्वसनीयता	सही परीक्षण	अस्थिर टेस्ट	कुल आउटपुट टोकन	कुल लागत	प्रतिक्रिया समय (औसत)
2026-04-11 01:44 · पहला दर्ज रन	8.1	9.5	लागू नहीं	13/18	1	85,545	$0.000	15.27s
2026-05-22 00:01 · दोबारा परीक्षण	7.8	9.2	10.0	13/20	2	126,760	$0.082	26.78s
अंतर	+0.4	+0.3		0	-1	-41215	-$0.082	-11508ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

Qwen3.6 PlusmediumvsQwen3.5-27Bmedium Qwen3.6 PlusmediumvsQwen3.5 Plus 2026-02-15medium Qwen3.6 PlusmediumvsClaude Sonnet 4.6medium Qwen3.6 PlusmediumvsGPT-5.4 Minimedium Qwen3.6 PlusmediumvsGemini 3.1 Flash Lite Previewmedium Qwen3.6 PlusmediumvsGemini 3.5 Flashhigh Qwen3.6 PlusmediumvsGemini 3 Flash Previewmedium Qwen3.6 PlusmediumvsNemotron 3 Ultra 550b A55bmediumनिःशुल्क उपलब्ध Qwen3.6 PlusmediumvsGPT-5.5low

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	10.0	10.0
कोडिंग	3.0	10.0
संयुक्त	10.0	10.0
डेटा पार्सिंग और निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	2.9	7.2
Samanya Buddhimatta	5.1	10.0
निर्देश पालन	10.0	10.0
पहेली समाधान	10.0	10.0
टूल कॉलिंग	10.0	10.0

Qwen3.6 Plus

Hamster playing table tennis

#21 Qwen3.6 Plus

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल