#60

Qwen3.5-9B

Qwen · रिलीज़: 2026-03-02 · qwen/qwen3.5-9b::none

औसत स्कोर

3.4

प्रति परिणाम लागत

0.111

संगति

10.0

कुल लागत

$0.005

सही परीक्षण

गलत टेस्ट: 12

प्रति प्रयास पास दर: 25.0%

अस्थिर टेस्ट

0

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

1.06s

प्रतिक्रिया समय (अधिकतम): 5.91s

प्रतिक्रिया समय (कुल): 16.95s

गलत उत्तर: 8 निर्देशों का पालन नहीं किया: 3 अमान्य टूल कॉल: 1

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

स्कोर के अनुसार शीर्ष मॉडल

औसत स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

औसत स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

औसत स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

Qwen3.5-9BnonevsQwen3 Coder Nextmedium Qwen3.5-9BnonevsGLM 4.7 Flashnone Qwen3.5-9BnonevsMercury 2none Qwen3.5-9BnonevsQwen3 Coder Nextnone Qwen3.5-9BnonevsGLM 4.7 Flashmedium Qwen3.5-9BnonevsGemini 3 Flash Previewmedium Qwen3.5-9BnonevsGemini 3.1 Pro Previewmedium Qwen3.5-9BnonevsStep 3.5 Flashmediumनिःशुल्क उपलब्ध

श्रेणी विवरण

श्रेणी	औसत स्कोर	संगति	सही परीक्षण
एंटी-एआई ट्रिक्स	10.0	9.9
संयुक्त	10.0	10.0
डेटा पार्सिंग और निष्कर्षण	9.9	10.0
डोमेन-विशिष्ट	10.0	10.0
Samanya Buddhimatta	3.0	9.9
निर्देश पालन	5.5	10.0
पहेली समाधान	10.0	9.9
टूल कॉलिंग	10.0	10.0

तुलना किए गए मॉडल