AI BENCHY
Advertise here
#21

Qwen3.6 Plus

Qwen प्रकाशन: 2026-04-20 चाचणी तारीख: 2026-04-11 01:44 qwen/qwen3.6-plus::medium

सारांश

Qwen3.6 Plus AI BENCHY वर 8.1 स्कोर करते आणि #21 वर आहे. याची reliability लागू नाही, pass rate 74.1%, एकूण खर्च $0.000, आणि सरासरी response time 15.27s आहे.

Qwen3.6 Plus खास का आहे: हे अँटी-एआय युक्त्या मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #1 आहे; तर कोडिंग हा सर्वात कमकुवत भाग आहे, rank #17. या score range साठी एकूण benchmark खर्च असामान्यपणे कमी आहे.

ओळख नोंद

Qwen3.6 Plus Preview हे Qwen3.6 Plus ची प्रीव्ह्यू आवृत्ती होती.

सुसंगतता

9.5

विश्वसनीयता

लागू नाही

एकूण आउटपुट टोकन्स

85,545

एकूण इनपुट टोकन्स

0

इनपुट किंमत

$0.325 / 1M

आउटपुट किंमत

$1.950 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 5

प्रति प्रयत्न पास दर: 74.1%

अस्थिर चाचण्या

1

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

15.27s

प्रतिसाद वेळ (कमाल): 43.55s

प्रतिसाद वेळ (एकूण): 259.55s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#21 Qwen3.6 Plus

medium
खर्च
$0.024
वेळ
219.0s
टोकन्स
12,235 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 13:30 नवीन चाचणी जोडली 7.9 10.0 $0.294 तुलना करा
2026-05-22 00:01 पुन्हा चाचणी 7.8 10.0 $0.082 तुलना करा
2026-04-11 01:44 पहिली नोंदलेली रन 8.1 लागू नाही $0.000 सध्याची रन

रन तुलना

रनस्कोअरसुसंगतताविश्वसनीयताबरोबर चाचण्याअस्थिर चाचण्याएकूण आउटपुट टोकन्सएकूण इनपुट टोकन्सएकूण खर्चप्रतिसाद वेळ (सरासरी)
2026-04-11 01:44 · पहिली नोंदलेली रन8.19.5लागू नाही13/18185,5450$0.00015.27s
2026-05-22 00:01 · पुन्हा चाचणी7.89.210.013/202126,7600$0.08226.78s
फरक+0.4+0.30-1-412150-$0.082-11508ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 10.0 10.0
कोडिंग 3.0 10.0
संयुक्त 10.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 2.9 7.2
Samanya Buddhimatta 5.1 10.0
सूचनांचे पालन 10.0 10.0
कोडी सोडवणे 10.0 10.0
टूल कॉलिंग 10.0 10.0

तुलना केलेली मॉडेल्स