Qwen3.6 35B A3B

Qwen रिलीज़: 2026-04-20 परीक्षण किया गया: 2026-04-27 23:06 qwen/qwen3.6-35b-a3b::medium

(medium) (none)

सारांश

Qwen3.6 35B A3B AI BENCHY पर 8.8 स्कोर करता है और #9 पर है। इसकी reliability 10.0, pass rate 83.3%, कुल लागत $0.104, और औसत response time 11.98s है।

Qwen3.6 35B A3B को अलग क्या बनाता है: इस score range के लिए इसकी कुल benchmark लागत असामान्य रूप से कम है।

स्कोर

8.8

संगति

9.5

विश्वसनीयता

10.0

कुल लागत (वर्तमान कीमत)

$0.104

कुल आउटपुट टोकन

112,261

कुल इनपुट टोकन

इनपुट कीमत

$0.162 / 1M

आउटपुट कीमत

$0.966 / 1M

सही परीक्षण

गलत टेस्ट: 3

प्रति प्रयास पास दर: 83.3%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

11.98s

प्रतिक्रिया समय (अधिकतम): 45.02s

प्रतिक्रिया समय (कुल): 191.76s

गलत उत्तर: 2 निर्देशों का पालन नहीं किया: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#9 Qwen3.6 35B A3B

medium

अमान्य SVG

लागत: $0.000
समय: 300.0s
टोकन: 0 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-07-16 22:06 नया टेस्ट जोड़ा गया	6.7	10.0	$0.746 ↑	तुलना करें
2026-06-04 13:20 नया टेस्ट जोड़ा गया	7.4	10.0	$0.146 ↑	तुलना करें
2026-05-22 00:02 सूट बदला गया	7.8	9.4	$0.126	तुलना करें
2026-04-27 23:06 पहला रन	8.8	10.0	$0.104	वर्तमान रन

रन तुलना

रन	स्कोर	संगति	विश्वसनीयता	सही परीक्षण	अस्थिर टेस्ट	कुल आउटपुट टोकन	कुल लागत	प्रतिक्रिया समय (औसत)
2026-04-27 23:06 · पहला रन	8.8	9.5	10.0	13/16	1	112,261	$0.104	11.98s
2026-05-22 00:02 · सूट बदला गया	7.8	9.1	9.4	12/18	2	134,075	$0.126	17.26s
अंतर	+1.0	+0.4	+0.6	+1	-1	-21814	-$0.023	-5280ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

Qwen3.6 35B A3BmediumvsGemini 3 Flash Previewnone Qwen3.6 35B A3BmediumvsGemini 3.5 Flash-Litelow Qwen3.6 35B A3BmediumvsGemini 3.5 Flashminimal Qwen3.6 35B A3BmediumvsLongCat 2.0low Qwen3.6 35B A3BmediumvsGPT-5.5none Qwen3.6 35B A3BmediumvsKAT-Coder-Pro V2.5none Qwen3.6 35B A3BmediumvsStep 3.7 Flashhigh Qwen3.6 35B A3BmediumvsGemma 4 26B A4Bmediumनिःशुल्क उपलब्ध Qwen3.6 35B A3BmediumvsQwen3.6 Flashmedium Qwen3.6 35B A3BmediumvsGLM 5.2none

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	10.0	10.0
कोडिंग	10.0	10.0
संयुक्त	0.0	0.0
डेटा पार्सिंग और निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	5.3	7.2
Samanya Buddhimatta	4.4	9.9
निर्देश पालन	10.0	10.0
पहेली समाधान	10.0	10.0
टूल कॉलिंग	0.0	0.0

Qwen3.6 35B A3B

Hamster playing table tennis

#9 Qwen3.6 35B A3B

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल