AI BENCHY
Advertise here
#162

Qwen3.5-9B

Qwen प्रकाशन: 2026-03-02 चाचणी तारीख: 2026-06-04 13:41 qwen/qwen3.5-9b::medium
(medium) (none)

सारांश

Qwen3.5-9B AI BENCHY वर 4.2 स्कोर करते आणि #162 वर आहे. याची reliability 6.7, pass rate 27.0%, एकूण खर्च $0.036, आणि सरासरी response time 82.24s आहे.

Qwen3.5-9B खास का आहे: या score range साठी एकूण benchmark खर्च असामान्यपणे कमी आहे. हे असामान्यपणे जास्त reasoning tokens वापरते, ज्यामुळे runs हळू किंवा महाग होऊ शकतात.

सुसंगतता

8.0

एकूण खर्च (सध्याची किंमत)

$0.036 ↑ +0.4%

या किमतीवर चाचणी केली: $0.036

एकूण आउटपुट टोकन्स

238,561

एकूण इनपुट टोकन्स

17,070

इनपुट किंमत

$0.100 / 1M

आउटपुट किंमत

$0.150 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 18

प्रति प्रयत्न पास दर: 27.0%

अस्थिर चाचण्या

5

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

82.24s

प्रतिसाद वेळ (कमाल): 226.38s

प्रतिसाद वेळ (एकूण): 1315.88s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#162 Qwen3.5-9B

medium
Cost
$0.001
Time
35.9s
Tokens
3,030 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 13:41 नवीन चाचणी जोडली 4.2 5.6 $0.035 सध्याची रन
2026-05-22 00:18 सूट बदलला 4.2 1.7 $0.035 तुलना करा
2026-05-08 14:44 सूट बदलला 4.3 3.3 $0.035 तुलना करा
2026-05-08 14:44 सूट बदलला 4.3 3.3 $0.035 तुलना करा
2026-04-20 17:48 पहिली नोंदलेली रन 4.4 लागू नाही $0.030 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रनस्कोअरसुसंगतताविश्वसनीयताबरोबर चाचण्याअस्थिर चाचण्याएकूण आउटपुट टोकन्सएकूण इनपुट टोकन्सएकूण खर्चप्रतिसाद वेळ (सरासरी)
2026-06-04 13:41 · सध्याची रन4.28.06.73/215238,56117,070$0.03682.24s
2026-05-08 14:44 · सूट बदलला4.36.93.33/197229,6560$0.03580.10s
फरक-0.1+1.1+3.40-2+8905+17070+$0.002+2142ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 15:40 $0.040 / 1M $0.150 / 1M
2026-06-10 13:42 $0.100 / 1M $0.150 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 5.1 5.8
कोडिंग 2.9 10.0
संयुक्त 3.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 3.6 5.6
डोमेन-विशिष्ट 3.6 7.2
Samanya Buddhimatta 2.8 1.6
सूचनांचे पालन 6.5 10.0
कोडी सोडवणे 3.0 10.0
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स