AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com
#161

Qwen3.5-9B

Qwen प्रकाशन: 2026-03-02 चाचणी तारीख: 2026-06-04 13:41 qwen/qwen3.5-9b::medium
(medium) (none)

सारांश

Qwen3.5-9B AI BENCHY वर 4.2 स्कोर करते आणि #161 वर आहे. याची reliability 6.7, pass rate 27.0%, एकूण खर्च $0.035, आणि सरासरी response time 82.24s आहे.

Qwen3.5-9B खास का आहे: या score range साठी एकूण benchmark खर्च असामान्यपणे कमी आहे. हे असामान्यपणे जास्त reasoning tokens वापरते, ज्यामुळे runs हळू किंवा महाग होऊ शकतात.

सुसंगतता

8.0

एकूण खर्च (सध्याची किंमत)

$0.035 ↓ -2.5%

या किमतीवर चाचणी केली: $0.036

एकूण आउटपुट टोकन्स

238,561

एकूण इनपुट टोकन्स

17,070

इनपुट किंमत

$0.040 / 1M

आउटपुट किंमत

$0.150 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 18

प्रति प्रयत्न पास दर: 27.0%

अस्थिर चाचण्या

5

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

82.24s

प्रतिसाद वेळ (कमाल): 226.38s

प्रतिसाद वेळ (एकूण): 1315.88s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#161 Qwen3.5-9B

medium
Cost
$0.001
Time
35.9s
Tokens
3,030 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 13:41 नवीन चाचणी जोडली 4.2 5.6 $0.035 सध्याची रन
2026-05-22 00:18 सूट बदलला 4.2 1.7 $0.035 तुलना करा
2026-05-08 14:44 सूट बदलला 4.3 3.3 $0.035 तुलना करा
2026-05-08 14:44 सूट बदलला 4.3 3.3 $0.035 तुलना करा
2026-04-20 17:48 पहिली नोंदलेली रन 4.4 लागू नाही $0.030 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 15:40 $0.040 / 1M $0.150 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 5.1 5.8
कोडिंग 2.9 10.0
संयुक्त 3.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 3.6 5.6
डोमेन-विशिष्ट 3.6 7.2
Samanya Buddhimatta 2.8 1.6
सूचनांचे पालन 6.5 10.0
कोडी सोडवणे 3.0 10.0
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स