#48

Qwen3.5-35B-A3B

Qwen प्रकाशन: 2026-02-24 चाचणी तारीख: 2026-04-11 01:44 qwen/qwen3.5-35b-a3b::medium

(medium) (none)

सारांश

Qwen3.5-35B-A3B AI BENCHY वर 7.4 स्कोर करते आणि #48 वर आहे. याची reliability लागू नाही, pass rate 79.6%, एकूण खर्च $0.398, आणि सरासरी response time 44.51s आहे.

Qwen3.5-35B-A3B खास का आहे: हे कोडिंग मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #1 आहे; तर Samanya Buddhimatta हा सर्वात कमकुवत भाग आहे, rank #18.

स्कोअर

7.4

सुसंगतता

6.7

विश्वसनीयता

लागू नाही

एकूण खर्च (सध्याची किंमत)

$0.398

एकूण आउटपुट टोकन्स

218,898

एकूण इनपुट टोकन्स

इनपुट किंमत

$0.163 / 1M

आउटपुट किंमत

$1.300 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 8

प्रति प्रयत्न पास दर: 79.6%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

44.51s

प्रतिसाद वेळ (कमाल): 106.00s

प्रतिसाद वेळ (एकूण): 801.21s

वेळ संपला: 4 चुकीचे उत्तर: 2 API त्रुटी: 1 उत्तर नाही: 1

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#48 Qwen3.5-35B-A3B

medium

खर्च: $0.009
वेळ: 71.4s
टोकन्स: 8,631 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-06-04 13:42 नवीन चाचणी जोडली	7.1	8.9	$0.401 ↓	तुलना करा
2026-05-22 00:15 सूट बदलला	7.0	6.7	$0.547	तुलना करा
2026-04-11 01:44 पहिली नोंदलेली रन	7.4	लागू नाही	$0.398	सध्याची रन

रन तुलना

रन	स्कोअर	सुसंगतता	विश्वसनीयता	बरोबर चाचण्या	अस्थिर चाचण्या	एकूण आउटपुट टोकन्स	एकूण खर्च	प्रतिसाद वेळ (सरासरी)
2026-04-11 01:44 · पहिली नोंदलेली रन	7.4	6.7	लागू नाही	10/18	7	218,898	$0.398	44.51s
2026-05-22 00:15 · सूट बदलला	7.0	7.1	6.7	10/20	7	367,406	$0.547	69.43s
फरक	+0.4	-0.4		0	0	-148508	-$0.149	-24916ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

Qwen3.5-35B-A3Bmediumvsgpt-oss-120bmediumमोफत उपलब्ध Qwen3.5-35B-A3BmediumvsStep 3.5 Flashmedium Qwen3.5-35B-A3BmediumvsQwen3.6 27Bmedium Qwen3.5-35B-A3BmediumvsMiMo-V2.5medium Qwen3.5-35B-A3BmediumvsGemini 3.1 Flash Lite Previewlow Qwen3.5-35B-A3BmediumvsGemini 3.5 Flashhigh Qwen3.5-35B-A3BmediumvsGemini 3 Flash Previewmedium Qwen3.5-35B-A3BmediumvsNemotron 3 Ultra 550b A55bmediumमोफत उपलब्ध Qwen3.5-35B-A3BmediumvsGPT-5.5low

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	10.0	10.0
कोडिंग	10.0	10.0
संयुक्त	4.7	1.6
डेटा पार्सिंग आणि निष्कर्षण	7.3	5.9
डोमेन-विशिष्ट	4.1	4.4
Samanya Buddhimatta	2.8	1.6
सूचनांचे पालन	10.0	10.0
कोडी सोडवणे	6.4	4.4
टूल कॉलिंग	10.0	10.0

Qwen3.5-35B-A3B

Hamster playing table tennis

#48 Qwen3.5-35B-A3B

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स