#10

Qwen3.6 Plus Preview

Qwen रिलीज़: 2026-04-20 परीक्षण किया गया: 2026-04-11 00:35 qwen/qwen3.6-plus-preview::medium

सारांश

Qwen3.6 Plus Preview AI BENCHY पर 8.5 स्कोर करता है और #10 पर है। इसकी reliability लागू नहीं, pass rate 76.5%, कुल लागत $0.000, और औसत response time 13.94s है।

Qwen3.6 Plus Preview को अलग क्या बनाता है: इस score range के लिए इसकी कुल benchmark लागत असामान्य रूप से कम है।

संग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।

पहचान नोट

Qwen3.6 Plus Preview, Qwen: Qwen3.6 Plus का प्रीव्यू संस्करण था।

स्कोर

8.5

संगति

10.0

विश्वसनीयता

लागू नहीं

कुल लागत (वर्तमान कीमत)

$0.000

कुल आउटपुट टोकन

78,969

कुल इनपुट टोकन

इनपुट कीमत

$0.000 / 1M

आउटपुट कीमत

$0.000 / 1M

सही परीक्षण

गलत टेस्ट: 4

प्रति प्रयास पास दर: 76.5%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

13.94s

प्रतिक्रिया समय (अधिकतम): 43.55s

प्रतिक्रिया समय (कुल): 237.01s

गलत उत्तर: 3 निर्देशों का पालन नहीं किया: 1

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	सही परीक्षण	कुल लागत	तुलना करें
2026-05-08 15:18 सूट बदला गया	6.3	लागू नहीं		$0.000	तुलना करें
2026-04-11 00:35 पहला दर्ज रन	8.5	लागू नहीं		$0.000	वर्तमान रन

रन तुलना

रन	स्कोर	संगति	विश्वसनीयता	सही परीक्षण	कुल आउटपुट टोकन	कुल इनपुट टोकन	कुल लागत	प्रतिक्रिया समय (औसत)
2026-04-11 00:35 · पहला दर्ज रन	8.5	10.0	लागू नहीं	13/17	78,969	0	$0.000	13.94s
2026-05-08 15:18 · सूट बदला गया	6.3	10.0	लागू नहीं	9/19	63,350	32,639	$0.000	15.25s
अंतर	+2.1	0.0		+4	+15619	-32639	$0.000	-1305ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

Qwen3.6 Plus Previewmediumनिःशुल्क उपलब्धvsGemini 3.5 Flashhigh Qwen3.6 Plus Previewmediumनिःशुल्क उपलब्धvsGemini 3 Flash Previewmedium Qwen3.6 Plus Previewmediumनिःशुल्क उपलब्धvsNemotron 3 Ultra 550b A55bmediumनिःशुल्क उपलब्ध Qwen3.6 Plus Previewmediumनिःशुल्क उपलब्धvsGPT-5.5low

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	10.0	10.0
संयुक्त	10.0	10.0
डेटा पार्सिंग और निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	3.0	10.0
Samanya Buddhimatta	5.1	10.0
निर्देश पालन	10.0	10.0
पहेली समाधान	10.0	10.0
टूल कॉलिंग	10.0	10.0

Qwen3.6 Plus Preview

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल