#107

Qwen3.6 Max Preview

Qwen रिलीज़: 2026-04-20 परीक्षण किया गया: 2026-07-16 21:32 qwen/qwen3.6-max-preview::none

(medium) (none)

सारांश

Qwen3.6 Max Preview AI BENCHY पर 6.6 स्कोर करता है और #107 पर है। इसकी reliability 9.9, pass rate 60.6%, कुल लागत $0.231, और औसत response time 7.82s है।

Qwen3.6 Max Preview को अलग क्या बनाता है: यह डोमेन-विशिष्ट में सबसे अलग दिखता है, जहाँ इसकी रैंक #1 है; जबकि एंटी-एआई ट्रिक्स इसकी सबसे कमजोर जगह है, जहाँ यह #12 पर है।

स्कोर

6.6

संगति

9.3

विश्वसनीयता

9.9

कुल लागत (वर्तमान कीमत)

$0.231 ↓ -6.7%

परीक्षण के समय: $0.248

कुल आउटपुट टोकन

19,257

कुल इनपुट टोकन

106,339

इनपुट कीमत

$1.040 / 1M

आउटपुट कीमत

$6.240 / 1M

सही परीक्षण

गलत टेस्ट: 10

प्रति प्रयास पास दर: 60.6%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

7.82s

प्रतिक्रिया समय (अधिकतम): 102.62s

प्रतिक्रिया समय (कुल): 172.01s

गलत उत्तर: 10

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#107 Qwen3.6 Max Preview

none

लागत: $0.025
समय: 83.9s
टोकन: 4,066 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-07-16 21:32 नया टेस्ट जोड़ा गया	6.6	9.9	$0.231 ↓	वर्तमान रन
2026-06-04 13:21 नया टेस्ट जोड़ा गया	6.9	10.0	$0.075 ↓	तुलना करें
2026-05-21 23:53 सूट बदला गया	7.1	10.0	$0.088	तुलना करें
2026-04-27 23:05 पहला रन	7.3	10.0	$0.083	तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख	इनपुट कीमत	आउटपुट कीमत
2026-06-04 15:40	$1.040 / 1M	$6.240 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	5.2	7.9
कोडिंग	3.8	7.3
संयुक्त	6.5	10.0
डेटा पार्सिंग और निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	7.7	10.0
Samanya Buddhimatta	4.3	10.0
निर्देश पालन	9.8	10.0
पहेली समाधान	10.0	10.0
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

Qwen3.6 Max Preview

Hamster playing table tennis

#107 Qwen3.6 Max Preview

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल