AI BENCHY
Advertise here
#15

Qwen3.6 Max Preview

Qwen प्रकाशन: 2026-04-20 चाचणी तारीख: 2026-06-04 13:25 qwen/qwen3.6-max-preview::medium
(medium) (none)

सारांश

Qwen3.6 Max Preview AI BENCHY वर 8.5 स्कोर करते आणि #15 वर आहे. याची reliability 10.0, pass rate 81.0%, एकूण खर्च $0.960, आणि सरासरी response time 59.63s आहे.

Qwen3.6 Max Preview खास का आहे: हे असामान्यपणे जास्त reasoning tokens वापरते, ज्यामुळे runs हळू किंवा महाग होऊ शकतात.

सुसंगतता

9.3

एकूण खर्च (सध्याची किंमत)

$0.960 ↓ -14.7%

या किमतीवर चाचणी केली: $1.124

एकूण आउटपुट टोकन्स

146,640

एकूण इनपुट टोकन्स

42,362

इनपुट किंमत

$1.040 / 1M

आउटपुट किंमत

$6.240 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 5

प्रति प्रयत्न पास दर: 81.0%

अस्थिर चाचण्या

2

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

59.63s

प्रतिसाद वेळ (कमाल): 238.07s

प्रतिसाद वेळ (एकूण): 1252.17s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#15 Qwen3.6 Max Preview

medium
Cost
$0.024
Time
76.5s
Tokens
3,861 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 13:25 नवीन चाचणी जोडली 8.5 10.0 $0.960 सध्याची रन
2026-05-21 23:59 सूट बदलला 8.4 10.0 $1.036 तुलना करा
2026-04-27 23:07 पहिला रन 8.8 10.0 $0.823 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रनस्कोअरसुसंगतताविश्वसनीयताबरोबर चाचण्याअस्थिर चाचण्याएकूण आउटपुट टोकन्सएकूण इनपुट टोकन्सएकूण खर्चप्रतिसाद वेळ (सरासरी)
2026-06-04 13:25 · सध्याची रन8.59.310.016/212146,64042,362$0.96059.63s
2026-05-21 23:59 · सूट बदलला8.49.210.015/202133,0330$1.03658.41s
फरक+0.1+0.10.0+10+13607+42362-$0.077+1214ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 15:40 $1.040 / 1M $6.240 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 10.0 10.0
कोडिंग 8.8 7.8
संयुक्त 10.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 2.9 7.2
Samanya Buddhimatta 10.0 10.0
सूचनांचे पालन 10.0 10.0
कोडी सोडवणे 10.0 10.0
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स