नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Anthropic: Claude Sonnet 4.6 vs Qwen: Qwen3.5 Plus 2026-04-20

सारांश

Claude Sonnet 4.6 vs Qwen3.5 Plus 2026-04-20 benchmark तुलना: Claude Sonnet 4.6 average score में आगे है: 7.8 vs 7.8. Qwen3.5 Plus 2026-04-20 की benchmark लागत कम है: $0.317 vs $1.418. Claude Sonnet 4.6 तेज है: 17.06s vs 46.36s, pass rates 65.1% vs 66.7%.

अनुशंसित मॉडल: Qwen3.5 Plus 2026-04-20 - Its score stays close to the best score here (7.8 vs 7.8), while costing about 4.5x less than Claude Sonnet 4.6.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-02

मेट्रिक Claude Sonnet 4.6 Claude Sonnet 4.6 medium रिलीज़: 2026-02-17 Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 medium रिलीज़: 2026-04-20
स्कोर 7.8 7.8
रैंक #32 #34
विश्वसनीयता 10.0 10.0
संगति 9.1 9.0
सही परीक्षण
प्रति प्रयास पास दर 65.1% 66.7%
अस्थिर टेस्ट 2 2
कुल रन 63 63
प्रति परिणाम लागत 10.904 3.023
कुल लागत $1.418 $0.317
इनपुट कीमत $3.000 / 1M $0.300 / 1M
आउटपुट कीमत $15.000 / 1M $1.800 / 1M
कुल इनपुट टोकन 49,112 42,097
आउटपुट टोकन 54,703 2,280
रीजनिंग टोकन 29,970 166,613
प्रतिक्रिया समय (औसत) 17.06s 46.36s
प्रतिक्रिया समय (अधिकतम) 46.35s 189.38s
प्रतिक्रिया समय (कुल) 221.83s 973.57s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#32 Claude Sonnet 4.6

medium
अमान्य SVG
लागत
$0.000
समय
300.0s
टोकन
0 tok

#34 Qwen3.5 Plus 2026-04-20

medium
लागत
$0.008
समय
76.7s
टोकन
4,355 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 6.5 10.0 50.0% 0 2.98s 789 1,046 1,093
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 10.84s 672 215 7,748
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 5.7 6.6 44.4% 1 33.29s 6,995 16,089 3,686
Qwen3.5 Plus 2026-04-20 6.2 8.7 33.3% 0 125.25s 7,630 308 58,682
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 46.35s 18,351 5,871 3,962
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 92.41s 14,934 483 17,490
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 13.90s 8,676 649 742
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 38.32s 7,782 270 14,668
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 2.9 7.2 11.1% 1 0ms 471 25,790 16,919
Qwen3.5 Plus 2026-04-20 2.9 7.2 11.1% 1 53.10s 771 63 28,414
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.94s 564 256 433
Qwen3.5 Plus 2026-04-20 4.9 9.6 0.0% 0 25.30s 516 125 4,792
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 2.61s 792 318 552
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 20.25s 699 103 7,689
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 5.31s 816 592 646
Qwen3.5 Plus 2026-04-20 8.2 7.2 88.9% 1 17.67s 696 338 9,800
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 7.48s 11,454 655 351
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 14.72s 8,193 348 2,164
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 3.0 10.0 0.0% 0 30.09s 204 3,437 1,586
Qwen3.5 Plus 2026-04-20 3.0 10.0 0.0% 0 92.57s 204 27 15,166

त्वरित तुलना

तुलना जोड़ी बदलें