#112

Qwen3.6 35B A3B

Qwen प्रकाशन: 2026-04-20 चाचणी तारीख: 2026-04-27 23:05 qwen/qwen3.6-35b-a3b::none

(medium) (none)

सारांश

Qwen3.6 35B A3B AI BENCHY वर 5.1 स्कोर करते आणि #112 वर आहे. याची reliability 10.0, pass rate 39.6%, एकूण खर्च $0.019, आणि सरासरी response time 2.87s आहे.

Qwen3.6 35B A3B खास का आहे: हे कोडिंग मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #1 आहे; तर अँटी-एआय युक्त्या हा सर्वात कमकुवत भाग आहे, rank #16. या score range साठी एकूण benchmark खर्च असामान्यपणे कमी आहे. समान मॉडेल्सच्या तुलनेत हे लक्षणीय वेगवान आहे.

स्कोअर

5.1

सुसंगतता

7.4

विश्वसनीयता

10.0

एकूण खर्च (सध्याची किंमत)

$0.019

एकूण आउटपुट टोकन्स

17,503

एकूण इनपुट टोकन्स

इनपुट किंमत

$0.162 / 1M

आउटपुट किंमत

$0.966 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 12

प्रति प्रयत्न पास दर: 39.6%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

2.87s

प्रतिसाद वेळ (कमाल): 12.46s

प्रतिसाद वेळ (एकूण): 46.00s

चुकीचे उत्तर: 10 सूचनांचे पालन केले नाही: 2

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#112 Qwen3.6 35B A3B

none

खर्च: $0.008
वेळ: 30.1s
टोकन्स: 6,317 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-07-16 21:26 नवीन चाचणी जोडली	5.3	10.0	$0.061 ↑	तुलना करा
2026-06-04 13:19 नवीन चाचणी जोडली	4.6	10.0	$0.031 ↑	तुलना करा
2026-05-21 23:54 सूट बदलला	4.9	10.0	$0.030	तुलना करा
2026-04-27 23:05 पहिला रन	5.1	10.0	$0.019	सध्याची रन

रन तुलना

रन	स्कोअर	सुसंगतता	विश्वसनीयता	बरोबर चाचण्या	अस्थिर चाचण्या	एकूण आउटपुट टोकन्स	एकूण खर्च	प्रतिसाद वेळ (सरासरी)
2026-04-27 23:05 · पहिला रन	5.1	7.4	10.0	4/16	5	17,503	$0.019	2.87s
2026-05-21 23:54 · सूट बदलला	4.9	7.7	10.0	4/18	5	27,747	$0.030	3.83s
फरक	+0.2	-0.3	0.0	0	0	-10244	-$0.011	-955ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

Qwen3.6 35B A3BnonevsLaguna XS 2.1noneमोफत उपलब्ध Qwen3.6 35B A3BnonevsLing-2.6-1Tnone Qwen3.6 35B A3BnonevsLaguna S 2.1highमोफत उपलब्ध Qwen3.6 35B A3BnonevsInklingnone Qwen3.6 35B A3BnonevsGPT-5.6 Lunanone Qwen3.6 35B A3BnonevsMistral Small 4none Qwen3.6 35B A3BnonevsKAT-Coder-Air V2.5low Qwen3.6 35B A3BnonevsQwen3 Coder Nextnone Qwen3.6 35B A3BnonevsLaguna S 2.1mediumमोफत उपलब्ध Qwen3.6 35B A3BnonevsMistral Small 4medium

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	3.6	7.6
कोडिंग	10.0	10.0
संयुक्त	0.0	0.0
डेटा पार्सिंग आणि निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	3.5	4.4
Samanya Buddhimatta	4.4	3.0
सूचनांचे पालन	6.2	5.8
कोडी सोडवणे	3.2	9.9
टूल कॉलिंग	0.0	0.0

Qwen3.6 35B A3B

Hamster playing table tennis

#112 Qwen3.6 35B A3B

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स