AI BENCHY
Advertise here
#75

Qwen3.6 Max Preview

Qwen प्रकाशन: 2026-04-20 चाचणी तारीख: 2026-06-04 13:21 qwen/qwen3.6-max-preview::none
(medium) (none)

सारांश

Qwen3.6 Max Preview AI BENCHY वर 6.9 स्कोर करते आणि #75 वर आहे. याची reliability 10.0, pass rate 58.7%, एकूण खर्च $0.075, आणि सरासरी response time 3.30s आहे.

Qwen3.6 Max Preview खास का आहे: हे डोमेन-विशिष्ट मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #1 आहे; तर कोडिंग हा सर्वात कमकुवत भाग आहे, rank #14. समान मॉडेल्सच्या तुलनेत हे लक्षणीय वेगवान आहे.

सुसंगतता

9.2

एकूण खर्च (सध्याची किंमत)

$0.075 ↓ -18.3%

या किमतीवर चाचणी केली: $0.091

एकूण आउटपुट टोकन्स

4,779

एकूण इनपुट टोकन्स

42,509

इनपुट किंमत

$1.040 / 1M

आउटपुट किंमत

$6.240 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 10

प्रति प्रयत्न पास दर: 58.7%

अस्थिर चाचण्या

2

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

3.30s

प्रतिसाद वेळ (कमाल): 20.51s

प्रतिसाद वेळ (एकूण): 69.40s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#75 Qwen3.6 Max Preview

none
Cost
$0.025
Time
83.9s
Tokens
4,066 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 13:21 नवीन चाचणी जोडली 6.9 10.0 $0.075 सध्याची रन
2026-05-21 23:53 सूट बदलला 7.1 10.0 $0.088 तुलना करा
2026-04-27 23:05 पहिला रन 7.3 10.0 $0.083 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 15:40 $1.040 / 1M $6.240 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 5.2 7.9
कोडिंग 3.8 7.3
संयुक्त 3.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 7.7 10.0
Samanya Buddhimatta 4.3 10.0
सूचनांचे पालन 9.8 10.0
कोडी सोडवणे 10.0 10.0
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स