#10

Qwen3.6 Plus Preview

Qwen प्रकाशन: 2026-04-20 चाचणी तारीख: 2026-04-11 00:35 qwen/qwen3.6-plus-preview::medium

सारांश

Qwen3.6 Plus Preview AI BENCHY वर 8.5 स्कोर करते आणि #10 वर आहे. याची reliability लागू नाही, pass rate 76.5%, एकूण खर्च $0.000, आणि सरासरी response time 13.94s आहे.

Qwen3.6 Plus Preview खास का आहे: या score range साठी एकूण benchmark खर्च असामान्यपणे कमी आहे.

संग्रहित मॉडेल: हे मॉडेल आता अपडेट केले जाणार नाही आणि नवीन चाचण्यांवर तपासले जाणार नाही.

ओळख नोंद

Qwen3.6 Plus Preview हे Qwen: Qwen3.6 Plus ची प्रीव्ह्यू आवृत्ती होती.

स्कोअर

8.5

सुसंगतता

10.0

विश्वसनीयता

लागू नाही

एकूण खर्च (सध्याची किंमत)

$0.000

एकूण आउटपुट टोकन्स

78,969

एकूण इनपुट टोकन्स

इनपुट किंमत

$0.000 / 1M

आउटपुट किंमत

$0.000 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 4

प्रति प्रयत्न पास दर: 76.5%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

13.94s

प्रतिसाद वेळ (कमाल): 43.55s

प्रतिसाद वेळ (एकूण): 237.01s

चुकीचे उत्तर: 3 सूचनांचे पालन केले नाही: 1

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	बरोबर चाचण्या	एकूण खर्च	तुलना करा
2026-05-08 15:18 सूट बदलला	6.3	लागू नाही		$0.000	तुलना करा
2026-04-11 00:35 पहिली नोंदलेली रन	8.5	लागू नाही		$0.000	सध्याची रन

रन तुलना

रन	स्कोअर	सुसंगतता	विश्वसनीयता	बरोबर चाचण्या	एकूण आउटपुट टोकन्स	एकूण इनपुट टोकन्स	एकूण खर्च	प्रतिसाद वेळ (सरासरी)
2026-04-11 00:35 · पहिली नोंदलेली रन	8.5	10.0	लागू नाही	13/17	78,969	0	$0.000	13.94s
2026-05-08 15:18 · सूट बदलला	6.3	10.0	लागू नाही	9/19	63,350	32,639	$0.000	15.25s
फरक	+2.1	0.0		+4	+15619	-32639	$0.000	-1305ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

Qwen3.6 Plus Previewmediumमोफत उपलब्धvsGemini 3.5 Flashhigh Qwen3.6 Plus Previewmediumमोफत उपलब्धvsGemini 3 Flash Previewmedium Qwen3.6 Plus Previewmediumमोफत उपलब्धvsNemotron 3 Ultra 550b A55bmediumमोफत उपलब्ध Qwen3.6 Plus Previewmediumमोफत उपलब्धvsGPT-5.5low

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	10.0	10.0
संयुक्त	10.0	10.0
डेटा पार्सिंग आणि निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	3.0	10.0
Samanya Buddhimatta	5.1	10.0
सूचनांचे पालन	10.0	10.0
कोडी सोडवणे	10.0	10.0
टूल कॉलिंग	10.0	10.0

Qwen3.6 Plus Preview

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स