नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Anthropic: Claude Sonnet 4.6 vs Qwen: Qwen3.5-27B

सारांश

Claude Sonnet 4.6 vs Qwen3.5-27B benchmark तुलना: Qwen3.5-27B average score में आगे है: 7.9 vs 7.3. Claude Sonnet 4.6 की benchmark लागत कम है: $0.316 vs $0.536. Claude Sonnet 4.6 तेज है: 5.04s vs 68.39s, pass rates 55.6% vs 73.0%.

अनुशंसित मॉडल: Claude Sonnet 4.6 - Its score stays close to the best score here (7.3 vs 7.9), while costing about 1.7x less than Qwen3.5-27B.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-17

मेट्रिक Claude Sonnet 4.6 Claude Sonnet 4.6 none रिलीज़: 2026-02-17 Qwen3.5-27B Qwen3.5-27B medium रिलीज़: 2026-02-24
स्कोर 7.3 7.9
रैंक #55 #29
विश्वसनीयता 10.0 10.0
संगति 9.7 8.5
सही परीक्षण
प्रति प्रयास पास दर 55.6% 73.0%
अस्थिर टेस्ट 1 4
कुल रन 63 63
प्रति परिणाम लागत 2.870 4.901
कुल लागत $0.316 $0.536
इनपुट कीमत $3.000 / 1M $0.195 / 1M
आउटपुट कीमत $15.000 / 1M $1.560 / 1M
कुल इनपुट टोकन 57,886 42,164
आउटपुट टोकन 9,465 8,534
रीजनिंग टोकन 0 329,289
प्रतिक्रिया समय (औसत) 5.04s 68.39s
प्रतिक्रिया समय (अधिकतम) 23.84s 234.36s
प्रतिक्रिया समय (कुल) 70.60s 1436.24s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#55 Claude Sonnet 4.6

none
Cost
$0.038
Time
27.3s
Tokens
2,598 tok

#29 Qwen3.5-27B

medium
Cost
$0.008
Time
62.0s
Tokens
3,099 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 636 1,214 0
Qwen3.5-27B 8.7 7.9 91.7% 1 19.75s 672 569 31,505
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 5.5 10.0 33.3% 0 5.19s 8,522 2,127 0
Qwen3.5-27B 6.2 7.1 55.6% 1 160.69s 7,895 6,381 89,388
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 26,024 3,766 0
Qwen3.5-27B 10.0 10.0 100.0% 0 163.96s 14,946 483 9,991
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 8,574 252 0
Qwen3.5-27B 10.0 10.0 100.0% 0 30.26s 7,782 270 16,150
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 759 413 0
Qwen3.5-27B 5.3 10.0 33.3% 0 79.53s 553 43 52,368
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 513 192 0
Qwen3.5-27B 6.1 3.1 66.7% 1 101.41s 524 70 23,147
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 690 90 0
Qwen3.5-27B 10.0 10.0 100.0% 0 19.66s 699 97 11,638
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.53s 663 533 0
Qwen3.5-27B 8.2 7.7 77.8% 1 59.60s 696 242 70,096
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 11,301 447 0
Qwen3.5-27B 10.0 10.0 100.0% 0 7.45s 8,193 348 1,323
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 3.0 10.0 0.0% 0 4.67s 204 431 0
Qwen3.5-27B 3.0 10.0 0.0% 0 85.11s 204 31 23,683

त्वरित तुलना

तुलना जोड़ी बदलें