#48

Qwen3.5-35B-A3B

Qwen रिलीज़: 2026-02-24 परीक्षण किया गया: 2026-04-11 01:44 qwen/qwen3.5-35b-a3b::medium

(medium) (none)

सारांश

Qwen3.5-35B-A3B AI BENCHY पर 7.4 स्कोर करता है और #48 पर है। इसकी reliability लागू नहीं, pass rate 79.6%, कुल लागत $0.398, और औसत response time 44.51s है।

Qwen3.5-35B-A3B को अलग क्या बनाता है: यह कोडिंग में सबसे अलग दिखता है, जहाँ इसकी रैंक #1 है; जबकि Samanya Buddhimatta इसकी सबसे कमजोर जगह है, जहाँ यह #18 पर है।

स्कोर

7.4

संगति

6.7

विश्वसनीयता

लागू नहीं

कुल लागत (वर्तमान कीमत)

$0.398

कुल आउटपुट टोकन

218,898

कुल इनपुट टोकन

इनपुट कीमत

$0.163 / 1M

आउटपुट कीमत

$1.300 / 1M

सही परीक्षण

गलत टेस्ट: 8

प्रति प्रयास पास दर: 79.6%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

44.51s

प्रतिक्रिया समय (अधिकतम): 106.00s

प्रतिक्रिया समय (कुल): 801.21s

समय समाप्त: 4 गलत उत्तर: 2 API त्रुटि: 1 कोई उत्तर नहीं: 1

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#48 Qwen3.5-35B-A3B

medium

लागत: $0.009
समय: 71.4s
टोकन: 8,631 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-06-04 13:42 नया टेस्ट जोड़ा गया	7.1	8.9	$0.401 ↓	तुलना करें
2026-05-22 00:15 सूट बदला गया	7.0	6.7	$0.547	तुलना करें
2026-04-11 01:44 पहला दर्ज रन	7.4	लागू नहीं	$0.398	वर्तमान रन

रन तुलना

रन	स्कोर	संगति	विश्वसनीयता	सही परीक्षण	अस्थिर टेस्ट	कुल आउटपुट टोकन	कुल लागत	प्रतिक्रिया समय (औसत)
2026-04-11 01:44 · पहला दर्ज रन	7.4	6.7	लागू नहीं	10/18	7	218,898	$0.398	44.51s
2026-05-22 00:15 · सूट बदला गया	7.0	7.1	6.7	10/20	7	367,406	$0.547	69.43s
अंतर	+0.4	-0.4		0	0	-148508	-$0.149	-24916ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

Qwen3.5-35B-A3Bmediumvsgpt-oss-120bmediumनिःशुल्क उपलब्ध Qwen3.5-35B-A3BmediumvsStep 3.5 Flashmedium Qwen3.5-35B-A3BmediumvsQwen3.6 27Bmedium Qwen3.5-35B-A3BmediumvsMiMo-V2.5medium Qwen3.5-35B-A3BmediumvsGemini 3.1 Flash Lite Previewlow Qwen3.5-35B-A3BmediumvsGemini 3.5 Flashhigh Qwen3.5-35B-A3BmediumvsGemini 3 Flash Previewmedium Qwen3.5-35B-A3BmediumvsNemotron 3 Ultra 550b A55bmediumनिःशुल्क उपलब्ध Qwen3.5-35B-A3BmediumvsGPT-5.5low

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	10.0	10.0
कोडिंग	10.0	10.0
संयुक्त	4.7	1.6
डेटा पार्सिंग और निष्कर्षण	7.3	5.9
डोमेन-विशिष्ट	4.1	4.4
Samanya Buddhimatta	2.8	1.6
निर्देश पालन	10.0	10.0
पहेली समाधान	6.4	4.4
टूल कॉलिंग	10.0	10.0

Qwen3.5-35B-A3B

Hamster playing table tennis

#48 Qwen3.5-35B-A3B

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल