AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com
#155

Qwen3.5-9B

Qwen प्रकाशन: 2026-03-02 चाचणी तारीख: 2026-06-04 13:30 qwen/qwen3.5-9b::none
(medium) (none)

सारांश

Qwen3.5-9B AI BENCHY वर 4.6 स्कोर करते आणि #155 वर आहे. याची reliability 10.0, pass rate 20.6%, एकूण खर्च $0.006, आणि सरासरी response time 1.89s आहे.

सुसंगतता

9.7

एकूण खर्च (सध्याची किंमत)

$0.006 ↑ +10.0%

या किमतीवर चाचणी केली: $0.005

एकूण आउटपुट टोकन्स

3,952

एकूण इनपुट टोकन्स

48,041

इनपुट किंमत

$0.100 / 1M

आउटपुट किंमत

$0.150 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 17

प्रति प्रयत्न पास दर: 20.6%

अस्थिर चाचण्या

1

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

1.89s

प्रतिसाद वेळ (कमाल): 6.03s

प्रतिसाद वेळ (एकूण): 39.68s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#155 Qwen3.5-9B

none
Invalid SVG
Cost
$0.000
Time
300.0s
Tokens
0 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 13:30 नवीन चाचणी जोडली 4.6 10.0 $0.003 सध्याची रन
2026-05-22 00:02 सूट बदलला 4.6 10.0 $0.005 तुलना करा
2026-05-08 13:28 सूट बदलला 4.7 10.0 $0.005 तुलना करा
2026-05-08 13:28 सूट बदलला 4.7 10.0 $0.005 तुलना करा
2026-04-20 17:48 पहिली नोंदलेली रन 4.8 लागू नाही $0.005 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रनस्कोअरसुसंगतताविश्वसनीयताबरोबर चाचण्याअस्थिर चाचण्याएकूण आउटपुट टोकन्सएकूण इनपुट टोकन्सएकूण खर्चप्रतिसाद वेळ (सरासरी)
2026-06-04 13:30 · सध्याची रन4.69.710.04/2113,95248,041$0.0061.89s
2026-04-20 17:48 · पहिली नोंदलेली रन4.89.6लागू नाही4/1813,9510$0.0051.47s
फरक-0.2+0.100+1+48041+$0.001+421ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 15:40 $0.040 / 1M $0.150 / 1M
2026-06-10 13:42 $0.100 / 1M $0.150 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 3.1 9.9
कोडिंग 3.9 7.8
संयुक्त 3.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 3.0 10.0
Samanya Buddhimatta 4.4 9.9
सूचनांचे पालन 6.5 10.0
कोडी सोडवणे 3.2 10.0
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स