AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com
#132

Qwen3.5-122B-A10B

Qwen प्रकाशन: 2026-02-24 चाचणी तारीख: 2026-06-04 13:26 qwen/qwen3.5-122b-a10b::none
(medium) (none)

सारांश

Qwen3.5-122B-A10B AI BENCHY वर 5.3 स्कोर करते आणि #132 वर आहे. याची reliability 10.0, pass rate 31.8%, एकूण खर्च $0.020, आणि सरासरी response time 3.41s आहे.

Qwen3.5-122B-A10B खास का आहे: हे Samanya Buddhimatta मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #3 आहे; तर कोडिंग हा सर्वात कमकुवत भाग आहे, rank #13.

सुसंगतता

9.6

एकूण खर्च (सध्याची किंमत)

$0.020 ↓ -17.4%

या किमतीवर चाचणी केली: $0.024

एकूण आउटपुट टोकन्स

3,383

एकूण इनपुट टोकन्स

47,735

इनपुट किंमत

$0.260 / 1M

आउटपुट किंमत

$2.080 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 15

प्रति प्रयत्न पास दर: 31.8%

अस्थिर चाचण्या

1

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

3.41s

प्रतिसाद वेळ (कमाल): 46.00s

प्रतिसाद वेळ (एकूण): 71.59s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#132 Qwen3.5-122B-A10B

none
Cost
$0.016
Time
44.5s
Tokens
6,431 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 13:26 नवीन चाचणी जोडली 5.3 10.0 $0.020 सध्याची रन
2026-05-21 23:57 सूट बदलला 5.4 10.0 $0.023 तुलना करा
2026-04-11 01:44 पहिली नोंदलेली रन 5.7 लागू नाही $0.022 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 15:40 $0.260 / 1M $2.080 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 4.8 10.0
कोडिंग 3.7 7.0
संयुक्त 3.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 5.3 10.0
Samanya Buddhimatta 5.0 10.0
सूचनांचे पालन 6.3 10.0
कोडी सोडवणे 3.8 10.0
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स