AI BENCHY
Advertise here
#125

Qwen3.5-122B-A10B

Qwen प्रकाशन: 2026-02-24 चाचणी तारीख: 2026-06-04 13:26 qwen/qwen3.5-122b-a10b::none
(medium) (none)

सारांश

Qwen3.5-122B-A10B AI BENCHY वर 5.3 स्कोर करते आणि #125 वर आहे. याची reliability 10.0, pass rate 31.8%, एकूण खर्च $0.020, आणि सरासरी response time 3.41s आहे.

Qwen3.5-122B-A10B खास का आहे: हे अँटी-एआय युक्त्या मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #4 आहे; तर कोडिंग हा सर्वात कमकुवत भाग आहे, rank #14.

सुसंगतता

9.6

एकूण खर्च (सध्याची किंमत)

$0.020 ↓ -17.4%

या किमतीवर चाचणी केली: $0.024

एकूण आउटपुट टोकन्स

3,383

एकूण इनपुट टोकन्स

47,735

इनपुट किंमत

$0.260 / 1M

आउटपुट किंमत

$2.080 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 15

प्रति प्रयत्न पास दर: 31.8%

अस्थिर चाचण्या

1

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

3.41s

प्रतिसाद वेळ (कमाल): 46.00s

प्रतिसाद वेळ (एकूण): 71.59s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#125 Qwen3.5-122B-A10B

none
खर्च
$0.016
वेळ
44.5s
टोकन्स
6,431 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 13:26 नवीन चाचणी जोडली 5.3 10.0 $0.020 सध्याची रन
2026-05-21 23:57 सूट बदलला 5.4 10.0 $0.023 तुलना करा
2026-04-11 01:44 पहिली नोंदलेली रन 5.7 लागू नाही $0.022 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रनस्कोअरसुसंगतताविश्वसनीयताबरोबर चाचण्याअस्थिर चाचण्याएकूण आउटपुट टोकन्सएकूण इनपुट टोकन्सएकूण खर्चप्रतिसाद वेळ (सरासरी)
2026-06-04 13:26 · सध्याची रन5.39.610.06/2113,38347,735$0.0203.41s
2026-05-21 23:57 · सूट बदलला5.49.210.06/2023,3750$0.0233.38s
फरक-0.1+0.40.00-1+8+47735-$0.004+27ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 15:40 $0.260 / 1M $2.080 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 4.8 10.0
कोडिंग 3.7 7.0
संयुक्त 3.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 5.3 10.0
Samanya Buddhimatta 5.0 10.0
सूचनांचे पालन 6.3 10.0
कोडी सोडवणे 3.8 10.0
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स