नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Anthropic: Claude Sonnet 4.6 vs Qwen: Qwen3.6 Flash

सारांश

Claude Sonnet 4.6 vs Qwen3.6 Flash benchmark तुलना: Qwen3.6 Flash average score में आगे है: 7.5 vs 7.3. Qwen3.6 Flash की benchmark लागत कम है: $0.288 vs $0.316. Claude Sonnet 4.6 तेज है: 5.04s vs 19.25s, pass rates 55.6% vs 71.4%.

अनुशंसित मॉडल: Claude Sonnet 4.6 - Its score stays close to the best score here (7.3 vs 7.5), while responding about 3.8x faster than Qwen3.6 Flash.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-12

मेट्रिक Claude Sonnet 4.6 Claude Sonnet 4.6 none रिलीज़: 2026-02-17 Qwen3.6 Flash Qwen3.6 Flash medium रिलीज़: 2026-04-20
स्कोर 7.3 7.5
रैंक #56 #49
विश्वसनीयता 10.0 10.0
संगति 9.7 8.1
सही परीक्षण
प्रति प्रयास पास दर 55.6% 71.4%
अस्थिर टेस्ट 1 5
कुल रन 63 63
प्रति परिणाम लागत 2.870 3.030
कुल लागत $0.316 $0.288
इनपुट कीमत $3.000 / 1M $0.188 / 1M
आउटपुट कीमत $15.000 / 1M $1.125 / 1M
कुल इनपुट टोकन 57,886 42,362
आउटपुट टोकन 9,465 2,995
रीजनिंग टोकन 0 245,358
प्रतिक्रिया समय (औसत) 5.04s 19.25s
प्रतिक्रिया समय (अधिकतम) 23.84s 122.87s
प्रतिक्रिया समय (कुल) 70.60s 404.20s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#56 Claude Sonnet 4.6

none
Cost
$0.038
Time
27.3s
Tokens
2,598 tok

#49 Qwen3.6 Flash

medium
Invalid SVG
Cost
$0.008
Time
29.9s
Tokens
6,784 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 636 1,214 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 6.10s 672 624 14,024
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 5.5 10.0 33.3% 0 5.19s 8,522 2,127 0
Qwen3.6 Flash 5.0 5.1 44.5% 2 42.85s 7,895 495 67,967
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 26,024 3,766 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 20.28s 14,934 483 13,839
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 8,574 252 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 9.65s 7,782 270 13,155
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 759 413 0
Qwen3.6 Flash 3.5 4.4 33.3% 2 14.65s 771 60 24,409
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 513 192 0
Qwen3.6 Flash 4.8 9.9 0.0% 0 9.88s 516 140 5,445
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 690 90 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 6.05s 699 102 7,423
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.53s 663 533 0
Qwen3.6 Flash 8.2 7.2 88.9% 1 6.29s 696 460 10,860
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 11,301 447 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 4.00s 8,193 335 1,188
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 3.0 10.0 0.0% 0 4.67s 204 431 0
Qwen3.6 Flash 3.0 10.0 0.0% 0 122.87s 204 26 87,048

त्वरित तुलना

तुलना जोड़ी बदलें