नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Anthropic: Claude Sonnet 4.6 vs Qwen: Qwen3.6 27B

सारांश

Claude Sonnet 4.6 vs Qwen3.6 27B benchmark तुलना: Claude Sonnet 4.6 average score में आगे है: 6.8 vs 6.8. Claude Sonnet 4.6 की benchmark लागत कम है: $0.316 vs $0.336. Claude Sonnet 4.6 तेज है: 5.04s vs 59.71s, pass rates 55.6% vs 60.3%.

अनुशंसित मॉडल: Claude Sonnet 4.6 - It has the best score here (6.8), while responding about 11.8x faster than Qwen3.6 27B.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-10

मेट्रिक Claude Sonnet 4.6 Claude Sonnet 4.6 none रिलीज़: 2026-02-17 Qwen3.6 27B Qwen3.6 27B medium रिलीज़: 2026-04-20
स्कोर 6.8 6.8
रैंक #78 #79
विश्वसनीयता 10.0 10.0
संगति 9.7 8.2
सही परीक्षण
प्रति प्रयास पास दर 55.6% 60.3%
अस्थिर टेस्ट 1 5
कुल रन 63 63
प्रति परिणाम लागत 2.870 3.361
कुल लागत $0.316 $0.336
इनपुट कीमत $3.000 / 1M $0.290 / 1M
आउटपुट कीमत $15.000 / 1M $2.400 / 1M
कुल इनपुट टोकन 57,886 39,376
आउटपुट टोकन 9,465 16,189
रीजनिंग टोकन 0 122,521
प्रतिक्रिया समय (औसत) 5.04s 59.71s
प्रतिक्रिया समय (अधिकतम) 23.84s 168.22s
प्रतिक्रिया समय (कुल) 70.60s 1254.01s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#78 Claude Sonnet 4.6

none
Cost
$0.038
Time
27.3s
Tokens
2,598 tok

#79 Qwen3.6 27B

medium
Cost
$0.009
Time
39.6s
Tokens
3,090 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 636 1,214 0
Qwen3.6 27B 8.3 10.0 75.0% 0 12.62s 453 582 4,311
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 5.5 10.0 33.3% 0 5.19s 8,522 2,127 0
Qwen3.6 27B 7.7 10.0 66.7% 0 142.99s 5,051 7,968 43,367
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 26,024 3,766 0
Qwen3.6 27B 7.0 3.7 66.7% 1 83.07s 15,104 2,088 14,689
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 8,574 252 0
Qwen3.6 27B 3.5 1.4 50.0% 2 37.30s 7,778 568 9,404
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 759 413 0
Qwen3.6 27B 2.9 7.2 11.1% 1 73.38s 662 3,510 20,352
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 513 192 0
Qwen3.6 27B 6.5 3.4 66.7% 1 39.53s 516 81 3,045
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 690 90 0
Qwen3.6 27B 10.0 10.0 100.0% 0 37.96s 699 346 6,548
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.53s 663 533 0
Qwen3.6 27B 7.7 10.0 66.7% 0 61.14s 696 255 12,044
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 11,301 447 0
Qwen3.6 27B 10.0 10.0 100.0% 0 16.88s 8,213 390 2,954
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 3.0 10.0 0.0% 0 4.67s 204 431 0
Qwen3.6 27B 3.0 10.0 0.0% 0 80.99s 204 401 5,807

त्वरित तुलना

तुलना जोड़ी बदलें