#20

Qwen3.5-122B-A10B

Qwen प्रकाशन: 2026-02-24 चाचणी तारीख: 2026-04-11 01:44 qwen/qwen3.5-122b-a10b::medium

(medium) (none)

सारांश

Qwen3.5-122B-A10B AI BENCHY वर 8.1 स्कोर करते आणि #20 वर आहे. याची reliability लागू नाही, pass rate 79.6%, एकूण खर्च $0.528, आणि सरासरी response time 31.38s आहे.

Qwen3.5-122B-A10B खास का आहे: हे असामान्यपणे जास्त reasoning tokens वापरते, ज्यामुळे runs हळू किंवा महाग होऊ शकतात.

स्कोअर

8.1

सुसंगतता

8.6

विश्वसनीयता

लागू नाही

एकूण खर्च (सध्याची किंमत)

$0.528

एकूण आउटपुट टोकन्स

180,303

एकूण इनपुट टोकन्स

इनपुट किंमत

$0.260 / 1M

आउटपुट किंमत

$2.080 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 5

प्रति प्रयत्न पास दर: 79.6%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

31.38s

प्रतिसाद वेळ (कमाल): 119.29s

प्रतिसाद वेळ (एकूण): 564.84s

चुकीचे उत्तर: 3 वेळ संपला: 2

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#20 Qwen3.5-122B-A10B

medium

खर्च: $0.019
वेळ: 48.7s
टोकन्स: 6,034 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-06-04 13:31 नवीन चाचणी जोडली	7.8	10.0	$0.588 ↓	तुलना करा
2026-05-22 00:03 सूट बदलला	7.7	10.0	$0.650	तुलना करा
2026-04-11 01:44 पहिली नोंदलेली रन	8.1	लागू नाही	$0.528	सध्याची रन

रन तुलना

रन	स्कोअर	सुसंगतता	विश्वसनीयता	बरोबर चाचण्या	अस्थिर चाचण्या	एकूण आउटपुट टोकन्स	एकूण खर्च	प्रतिसाद वेळ (सरासरी)
2026-04-11 01:44 · पहिली नोंदलेली रन	8.1	8.6	लागू नाही	13/18	3	180,303	$0.528	31.38s
2026-05-22 00:03 · सूट बदलला	7.7	8.8	10.0	13/20	3	238,285	$0.650	39.29s
फरक	+0.4	-0.2		0	0	-57982	-$0.122	-7914ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

Qwen3.5-122B-A10BmediumvsGemini 3.1 Flash Litemedium Qwen3.5-122B-A10BmediumvsQwen3.5 Plus 2026-04-20medium Qwen3.5-122B-A10BmediumvsClaude Opus 4.8low Qwen3.5-122B-A10BmediumvsGemini 3.1 Flash Lite Previewmedium Qwen3.5-122B-A10BmediumvsGrok 4.3medium Qwen3.5-122B-A10BmediumvsGemini 3.5 Flashhigh Qwen3.5-122B-A10BmediumvsGemini 3 Flash Previewmedium Qwen3.5-122B-A10BmediumvsNemotron 3 Ultra 550b A55bmediumमोफत उपलब्ध Qwen3.5-122B-A10BmediumvsGPT-5.5low

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	10.0	10.0
कोडिंग	4.7	1.6
संयुक्त	10.0	10.0
डेटा पार्सिंग आणि निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	2.9	7.2
Samanya Buddhimatta	3.4	2.2
सूचनांचे पालन	10.0	10.0
कोडी सोडवणे	10.0	10.0
टूल कॉलिंग	10.0	10.0

Qwen3.5-122B-A10B

Hamster playing table tennis

#20 Qwen3.5-122B-A10B

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स