AI BENCHY तुलना

Anthropic: Claude Sonnet 5 vs Qwen: Qwen3.7 Plus

सारांश

Claude Sonnet 5 vs Qwen3.7 Plus benchmark तुलना: Claude Sonnet 5 average score में आगे है: 7.9 vs 7.2. Qwen3.7 Plus की benchmark लागत कम है: $0.023 vs $0.550. Qwen3.7 Plus तेज है: 2.85s vs 9.94s, pass rates 79.4% vs 47.6%.

अनुशंसित मॉडल: Qwen3.7 Plus - Its score stays close to the best score here (7.2 vs 7.9), while costing about 24.9x less than Claude Sonnet 5.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-30

मेट्रिक	Claude Sonnet 5 Claude Sonnet 5 medium रिलीज़: 2026-06-30	Qwen3.7 Plus Qwen3.7 Plus none रिलीज़: 2026-06-03

मेट्रिक	Claude Sonnet 5 Claude Sonnet 5 medium रिलीज़: 2026-06-30	Qwen3.7 Plus Qwen3.7 Plus none रिलीज़: 2026-06-03
स्कोर	7.9	7.2
रैंक	#30	#62
विश्वसनीयता	10.0	10.0
संगति	9.0	10.0
सही परीक्षण
प्रति प्रयास पास दर	79.4%	47.6%
अस्थिर टेस्ट	3	0
कुल रन	63	63
प्रति परिणाम लागत	3.662	0.276
कुल लागत	$0.550	$0.023
इनपुट कीमत	$2.000 / 1M	$0.320 / 1M
आउटपुट कीमत	$10.000 / 1M	$1.280 / 1M
कुल इनपुट टोकन	67,416	42,510
आउटपुट टोकन	34,012	6,578
रीजनिंग टोकन	7,673	0
प्रतिक्रिया समय (औसत)	9.94s	2.85s
प्रतिक्रिया समय (अधिकतम)	56.94s	29.38s
प्रतिक्रिया समय (कुल)	208.71s	59.86s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#30 Claude Sonnet 5

medium

लागत: $0.007
समय: 6.4s
टोकन: 832 tok

#62 Qwen3.7 Plus

none

लागत: $0.019
समय: 213.5s
टोकन: 11,960 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Sonnet 5	10.0	10.0	100.0%	0		3.80s	834	1,220	446
Qwen3.7 Plus	6.5	10.0	50.0%	0		1.38s	696	349	0

कोडिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Sonnet 5	9.0	7.9	88.9%	1		17.28s	10,590	13,153	2,379
Qwen3.7 Plus	5.5	10.0	33.3%	0		2.15s	7,911	639	0

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Sonnet 5	4.5	2.1	66.7%	1		37.01s	29,394	4,848	2,170
Qwen3.7 Plus	10.0	10.0	100.0%	0		29.38s	14,952	4,505	0

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Sonnet 5	10.0	10.0	100.0%	0		3.16s	10,503	312	0
Qwen3.7 Plus	10.0	10.0	100.0%	0		1.43s	7,794	243	0

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Sonnet 5	7.7	10.0	66.7%	0		20.38s	975	12,140	1,994
Qwen3.7 Plus	3.0	10.0	0.0%	0		868ms	789	18	0

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Sonnet 5	4.8	3.2	33.3%	1		4.32s	708	264	0
Qwen3.7 Plus	5.3	10.0	0.0%	0		1.33s	522	78	0

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Sonnet 5	9.9	10.0	100.0%	0		3.10s	909	318	269
Qwen3.7 Plus	6.3	10.0	50.0%	0		929ms	711	72	0

पहेली समाधान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Sonnet 5	7.7	10.0	66.7%	0		2.98s	894	407	121
Qwen3.7 Plus	7.7	10.0	66.7%	0		1.71s	714	443	0

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Sonnet 5	10.0	10.0	100.0%	0		10.70s	12,351	433	90
Qwen3.7 Plus	10.0	10.0	100.0%	0		3.54s	8,211	222	0

सामान्य ज्ञान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Sonnet 5	3.0	10.0	0.0%	0		7.06s	258	917	204
Qwen3.7 Plus	3.0	10.0	0.0%	0		1.21s	210	9	0

त्वरित तुलना

तुलना जोड़ी बदलें

Gemma 4 26B A4Bmediumनिःशुल्क उपलब्धvsQwen3.7 Plusnone Qwen3.7 PlusnonevsStep 3.7 Flashhigh Qwen3.7 PlusnonevsGLM 5.1medium Kimi K2.7 CodemediumvsQwen3.7 Plusnone Claude Sonnet 5mediumvsStep 3.7 Flashlow Qwen3.7 PlusnonevsGrok 4.20medium Gemini 3 Flash PreviewlowvsQwen3.7 Plusnone Qwen3.7 PlusnonevsMiMo-V2.5-Promedium Seed-2.0-MinimediumvsQwen3.7 Plusnone Claude Sonnet 5mediumvsDeepSeek V4 Prohigh DeepSeek V3.2mediumvsQwen3.7 Plusnone Gemini 3.5 FlashminimalvsQwen3.7 Plusnone