नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs Qwen: Qwen3.5-122B-A10B

सारांश

Claude Sonnet 4.6 vs Qwen3.5-122B-A10B benchmark तुलना: Qwen3.5-122B-A10B average score मध्ये पुढे आहे: 7.7 vs 7.3. Claude Sonnet 4.6 चा benchmark खर्च कमी आहे: $0.316 vs $0.588. Claude Sonnet 4.6 वेगवान आहे: 5.04s vs 42.49s, pass rates 55.6% vs 73.0%.

शिफारस केलेले मॉडेल: Claude Sonnet 4.6 - Its score stays close to the best score here (7.3 vs 7.7), while costing about 1.9x less than Qwen3.5-122B-A10B.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-18

मेट्रिक Claude Sonnet 4.6 Claude Sonnet 4.6 none प्रकाशन: 2026-02-17 Qwen3.5-122B-A10B Qwen3.5-122B-A10B medium प्रकाशन: 2026-02-24
स्कोअर 7.3 7.7
क्रमांक #55 #36
विश्वसनीयता 10.0 10.0
सुसंगतता 9.7 8.8
बरोबर चाचण्या
प्रति प्रयत्न पास दर 55.6% 73.0%
अस्थिर चाचण्या 1 3
एकूण रन 63 63
प्रति निकाल खर्च 2.870 5.235
एकूण खर्च $0.316 $0.588
इनपुट किंमत $3.000 / 1M $0.260 / 1M
आउटपुट किंमत $15.000 / 1M $2.080 / 1M
एकूण इनपुट टोकन्स 57,886 41,832
आउटपुट टोकन्स 9,465 26,187
रिझनिंग टोकन्स 0 251,028
प्रतिसाद वेळ (सरासरी) 5.04s 42.49s
प्रतिसाद वेळ (कमाल) 23.84s 168.16s
प्रतिसाद वेळ (एकूण) 70.60s 892.30s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#55 Claude Sonnet 4.6

none
खर्च
$0.038
वेळ
27.3s
टोकन्स
2,598 tok

#36 Qwen3.5-122B-A10B

medium
खर्च
$0.019
वेळ
48.7s
टोकन्स
6,034 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 636 1,214 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.75s 672 269 16,835
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 5.5 10.0 33.3% 0 5.19s 8,522 2,127 0
Qwen3.5-122B-A10B 6.0 7.2 55.6% 1 114.48s 7,630 8,057 82,578
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 26,024 3,766 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 107.79s 14,947 483 11,337
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 8,574 252 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 23.41s 7,782 270 16,558
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 759 413 0
Qwen3.5-122B-A10B 2.9 7.2 11.1% 1 63.40s 771 15,537 64,889
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 513 192 0
Qwen3.5-122B-A10B 3.4 2.2 33.3% 1 34.11s 344 66 7,592
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 690 90 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.88s 593 77 7,372
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.53s 663 533 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 17.89s 696 284 27,575
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 11,301 447 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 4.60s 8,193 322 1,226
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 3.0 10.0 0.0% 0 4.67s 204 431 0
Qwen3.5-122B-A10B 3.0 10.0 0.0% 0 52.87s 204 822 15,066

झटपट तुलना

तुलना जोडी बदला