#220

Qwen3.5-9B

Qwen रिलीज़: 2026-03-02 परीक्षण किया गया: 2026-07-16 23:12 qwen/qwen3.5-9b::medium

(medium) (none)

सारांश

Qwen3.5-9B AI BENCHY पर 3.8 स्कोर करता है और #220 पर है। इसकी reliability 5.0, pass rate 25.8%, कुल लागत $0.036, और औसत response time 82.24s है।

Qwen3.5-9B को अलग क्या बनाता है: इस score range के लिए इसकी कुल benchmark लागत असामान्य रूप से कम है।

स्कोर

3.8

संगति

8.1

विश्वसनीयता

5.0

कुल लागत (वर्तमान कीमत)

$0.036 ↑ +0.4%

परीक्षण के समय: $0.036

कुल आउटपुट टोकन

238,561

कुल इनपुट टोकन

17,070

इनपुट कीमत

$0.100 / 1M

आउटपुट कीमत

$0.150 / 1M

सही परीक्षण

गलत टेस्ट: 19

प्रति प्रयास पास दर: 25.8%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

82.24s

प्रतिक्रिया समय (अधिकतम): 226.38s

प्रतिक्रिया समय (कुल): 1315.88s

समय समाप्त: 12 कोई उत्तर नहीं: 2 गलत उत्तर: 2 API त्रुटि: 1 अतिरिक्त फॉर्मेटिंग: 1 निर्देशों का पालन नहीं किया: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#220 Qwen3.5-9B

medium

लागत: $0.001
समय: 35.9s
टोकन: 3,030 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-07-16 23:12 नया टेस्ट जोड़ा गया	3.8	5.0	$0.036 ↑	वर्तमान रन
2026-06-04 13:41 नया टेस्ट जोड़ा गया	4.2	5.6	$0.035 ↓	तुलना करें
2026-05-22 00:18 सूट बदला गया	4.2	1.7	$0.035	तुलना करें
2026-05-08 14:44 सूट बदला गया	4.3	3.3	$0.035	तुलना करें
2026-05-08 14:44 सूट बदला गया	4.3	3.3	$0.035	तुलना करें
2026-04-20 17:48 पहला दर्ज रन	4.4	लागू नहीं	$0.030	तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख	इनपुट कीमत	आउटपुट कीमत
2026-06-04 15:40	$0.040 / 1M	$0.150 / 1M
2026-06-10 13:42	$0.100 / 1M	$0.150 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

Qwen3.5-9BmediumvsGranite 4.1 8Bnone Qwen3.5-9Bmediumvsgpt-oss-120bnoneनिःशुल्क उपलब्ध Qwen3.5-9BmediumvsGrok 4.20none Qwen3.5-9BmediumvsGLM 4.7 Flashmedium Qwen3.5-9BmediumvsLaguna S 2.1noneनिःशुल्क उपलब्ध Qwen3.5-9BmediumvsMiniMax M2.5medium Qwen3.5-9BmediumvsMercury 2none Qwen3.5-9BmediumvsCobuddymedium Qwen3.5-9BmediumvsQwen3 Coder Nextmedium Qwen3.5-9BmediumvsTrinity Large Previewnone

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	5.1	5.8
कोडिंग	2.9	10.0
संयुक्त	3.0	10.0
डेटा पार्सिंग और निष्कर्षण	3.6	5.6
डोमेन-विशिष्ट	3.6	7.2
Samanya Buddhimatta	2.8	1.6
निर्देश पालन	6.5	10.0
पहेली समाधान	3.0	10.0
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

Qwen3.5-9B

Hamster playing table tennis

#220 Qwen3.5-9B

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल