#32

Qwen3.6 35B A3B

Qwen रिलीज़: 2026-04-20 परीक्षण किया गया: 2026-05-22 00:02 qwen/qwen3.6-35b-a3b::medium

(medium) (none)

सारांश

Qwen3.6 35B A3B AI BENCHY पर 7.8 स्कोर करता है और #32 पर है। इसकी reliability 9.4, pass rate 70.4%, कुल लागत $0.126, और औसत response time 17.26s है।

Qwen3.6 35B A3B को अलग क्या बनाता है: इस score range के लिए इसकी कुल benchmark लागत असामान्य रूप से कम है।

स्कोर

7.8

संगति

9.1

विश्वसनीयता

9.4

कुल लागत (वर्तमान कीमत)

$0.126

कुल आउटपुट टोकन

134,075

कुल इनपुट टोकन

इनपुट कीमत

$0.150 / 1M

आउटपुट कीमत

$1.000 / 1M

सही परीक्षण

गलत टेस्ट: 6

प्रति प्रयास पास दर: 70.4%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

17.26s

प्रतिक्रिया समय (अधिकतम): 86.11s

प्रतिक्रिया समय (कुल): 310.77s

गलत उत्तर: 4 निर्देशों का पालन नहीं किया: 1 कोई उत्तर नहीं: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#32 Qwen3.6 35B A3B

medium

अमान्य SVG

लागत: $0.000
समय: 300.0s
टोकन: 0 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-07-16 22:06 नया टेस्ट जोड़ा गया	6.7	10.0	$0.746 ↑	तुलना करें
2026-06-04 13:20 नया टेस्ट जोड़ा गया	7.4	10.0	$0.146 ↑	तुलना करें
2026-05-22 00:02 सूट बदला गया	7.8	9.4	$0.126	वर्तमान रन
2026-04-27 23:06 पहला रन	8.8	10.0	$0.104	तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

रन तुलना

रन	स्कोर	संगति	विश्वसनीयता	सही परीक्षण	अस्थिर टेस्ट	कुल आउटपुट टोकन	कुल इनपुट टोकन	कुल लागत	प्रतिक्रिया समय (औसत)
2026-05-22 00:02 · सूट बदला गया	7.8	9.1	9.4	12/18	2	134,075	0	$0.126	17.26s
2026-06-04 13:20 · नया टेस्ट जोड़ा गया	7.4	9.6	10.0	13/21	1	149,851	16,385	$0.146	18.08s
अंतर	+0.3	-0.5	-0.6	+1	+1	-15776	-16385	-$0.020	-820ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

Qwen3.6 35B A3BmediumvsGemini 3 Flash Previewnone Qwen3.6 35B A3BmediumvsGemini 3.5 Flash-Litelow Qwen3.6 35B A3BmediumvsGemini 3.5 Flashminimal Qwen3.6 35B A3BmediumvsLongCat 2.0low Qwen3.6 35B A3BmediumvsGPT-5.5none Qwen3.6 35B A3BmediumvsKAT-Coder-Pro V2.5none Qwen3.6 35B A3BmediumvsStep 3.7 Flashhigh Qwen3.6 35B A3BmediumvsGemma 4 26B A4Bmediumनिःशुल्क उपलब्ध Qwen3.6 35B A3BmediumvsQwen3.6 Flashmedium Qwen3.6 35B A3BmediumvsGLM 5.2none

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	10.0	10.0
कोडिंग	6.6	10.0
संयुक्त	0.0	0.0
डेटा पार्सिंग और निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	5.3	7.2
Samanya Buddhimatta	4.4	9.9
निर्देश पालन	10.0	10.0
पहेली समाधान	7.9	7.5
टूल कॉलिंग	0.0	0.0
सामान्य ज्ञान	3.0	10.0

Qwen3.6 35B A3B

Hamster playing table tennis

#32 Qwen3.6 35B A3B

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल