नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Anthropic: Claude Sonnet 4.6 vs Qwen: Qwen3.7 Plus

सारांश

Claude Sonnet 4.6 vs Qwen3.7 Plus benchmark तुलना: Claude Sonnet 4.6 average score में आगे है: 7.8 vs 7.2. Qwen3.7 Plus की benchmark लागत कम है: $0.023 vs $1.418. Qwen3.7 Plus तेज है: 2.85s vs 17.06s, pass rates 65.1% vs 47.6%.

अनुशंसित मॉडल: Qwen3.7 Plus - Its score stays close to the best score here (7.2 vs 7.8), while costing about 64.4x less than Claude Sonnet 4.6.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-02

मेट्रिक Claude Sonnet 4.6 Claude Sonnet 4.6 medium रिलीज़: 2026-02-17 Qwen3.7 Plus Qwen3.7 Plus none रिलीज़: 2026-06-03
स्कोर 7.8 7.2
रैंक #32 #62
विश्वसनीयता 10.0 10.0
संगति 9.1 10.0
सही परीक्षण
प्रति प्रयास पास दर 65.1% 47.6%
अस्थिर टेस्ट 2 0
कुल रन 63 63
प्रति परिणाम लागत 10.904 0.276
कुल लागत $1.418 $0.023
इनपुट कीमत $3.000 / 1M $0.320 / 1M
आउटपुट कीमत $15.000 / 1M $1.280 / 1M
कुल इनपुट टोकन 49,112 42,510
आउटपुट टोकन 54,703 6,578
रीजनिंग टोकन 29,970 0
प्रतिक्रिया समय (औसत) 17.06s 2.85s
प्रतिक्रिया समय (अधिकतम) 46.35s 29.38s
प्रतिक्रिया समय (कुल) 221.83s 59.86s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#32 Claude Sonnet 4.6

medium
अमान्य SVG
लागत
$0.000
समय
300.0s
टोकन
0 tok

#62 Qwen3.7 Plus

none
लागत
$0.019
समय
213.5s
टोकन
11,960 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 6.5 10.0 50.0% 0 2.98s 789 1,046 1,093
Qwen3.7 Plus 6.5 10.0 50.0% 0 1.38s 696 349 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 5.7 6.6 44.4% 1 33.29s 6,995 16,089 3,686
Qwen3.7 Plus 5.5 10.0 33.3% 0 2.15s 7,911 639 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 46.35s 18,351 5,871 3,962
Qwen3.7 Plus 10.0 10.0 100.0% 0 29.38s 14,952 4,505 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 13.90s 8,676 649 742
Qwen3.7 Plus 10.0 10.0 100.0% 0 1.43s 7,794 243 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 2.9 7.2 11.1% 1 0ms 471 25,790 16,919
Qwen3.7 Plus 3.0 10.0 0.0% 0 868ms 789 18 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.94s 564 256 433
Qwen3.7 Plus 5.3 10.0 0.0% 0 1.33s 522 78 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 2.61s 792 318 552
Qwen3.7 Plus 6.3 10.0 50.0% 0 929ms 711 72 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 5.31s 816 592 646
Qwen3.7 Plus 7.7 10.0 66.7% 0 1.71s 714 443 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 7.48s 11,454 655 351
Qwen3.7 Plus 10.0 10.0 100.0% 0 3.54s 8,211 222 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 3.0 10.0 0.0% 0 30.09s 204 3,437 1,586
Qwen3.7 Plus 3.0 10.0 0.0% 0 1.21s 210 9 0

त्वरित तुलना

तुलना जोड़ी बदलें