AI BENCHY तुलना

Anthropic: Claude Opus 4.6 vs Qwen: Qwen3.6 27B

सारांश

Claude Opus 4.6 vs Qwen3.6 27B benchmark तुलना: Claude Opus 4.6 average score में आगे है: 7.0 vs 6.8. Qwen3.6 27B की benchmark लागत कम है: $0.336 vs $2.053. Claude Opus 4.6 तेज है: 25.89s vs 59.71s, pass rates 61.9% vs 60.3%.

अनुशंसित मॉडल: Qwen3.6 27B - Its score stays close to the best score here (6.8 vs 7.0), while costing about 6.1x less than Claude Opus 4.6.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-10

मेट्रिक	Claude Opus 4.6 Claude Opus 4.6 medium रिलीज़: 2026-02-05	Qwen3.6 27B Qwen3.6 27B medium रिलीज़: 2026-04-20

मेट्रिक	Claude Opus 4.6 Claude Opus 4.6 medium रिलीज़: 2026-02-05	Qwen3.6 27B Qwen3.6 27B medium रिलीज़: 2026-04-20
स्कोर	7.0	6.8
रैंक	#70	#79
विश्वसनीयता	10.0	10.0
संगति	8.8	8.2
सही परीक्षण
प्रति प्रयास पास दर	61.9%	60.3%
अस्थिर टेस्ट	3	5
कुल रन	63	63
प्रति परिणाम लागत	17.103	3.361
कुल लागत	$2.053	$0.336
इनपुट कीमत	$5.000 / 1M	$0.290 / 1M
आउटपुट कीमत	$25.000 / 1M	$2.400 / 1M
कुल इनपुट टोकन	53,227	39,376
आउटपुट टोकन	47,446	16,189
रीजनिंग टोकन	24,000	122,521
प्रतिक्रिया समय (औसत)	25.89s	59.71s
प्रतिक्रिया समय (अधिकतम)	83.40s	168.22s
प्रतिक्रिया समय (कुल)	362.49s	1254.01s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#70 Claude Opus 4.6

medium

Invalid SVG

Cost: $0.000
Time: 300.0s
Tokens: 0 tok

#79 Qwen3.6 27B

medium

Cost: $0.009
Time: 39.6s
Tokens: 3,090 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Opus 4.6	6.4	5.8	66.7%	2		7.45s	840	986	1,071
Qwen3.6 27B	8.3	10.0	75.0%	0		12.62s	453	582	4,311

कोडिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Opus 4.6	5.7	7.1	44.4%	1		30.10s	8,522	13,057	4,121
Qwen3.6 27B	7.7	10.0	66.7%	0		142.99s	5,051	7,968	43,367

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Opus 4.6	10.0	10.0	100.0%	0		76.66s	20,685	8,178	5,194
Qwen3.6 27B	7.0	3.7	66.7%	1		83.07s	15,104	2,088	14,689

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Opus 4.6	10.0	10.0	100.0%	0		7.37s	8,676	691	757
Qwen3.6 27B	3.5	1.4	50.0%	2		37.30s	7,778	568	9,404

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Opus 4.6	3.0	10.0	0.0%	0		83.40s	674	14,642	8,687
Qwen3.6 27B	2.9	7.2	11.1%	1		73.38s	662	3,510	20,352

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Opus 4.6	10.0	10.0	100.0%	0		5.04s	564	188	292
Qwen3.6 27B	6.5	3.4	66.7%	1		39.53s	516	81	3,045

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Opus 4.6	10.0	10.0	100.0%	0		2.43s	792	266	467
Qwen3.6 27B	10.0	10.0	100.0%	0		37.96s	699	346	6,548

पहेली समाधान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Opus 4.6	7.7	10.0	66.7%	0		4.71s	816	532	630
Qwen3.6 27B	7.7	10.0	66.7%	0		61.14s	696	255	12,044

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Opus 4.6	10.0	10.0	100.0%	0		9.73s	11,454	861	329
Qwen3.6 27B	10.0	10.0	100.0%	0		16.88s	8,213	390	2,954

सामान्य ज्ञान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Claude Opus 4.6	3.0	10.0	0.0%	0		63.24s	204	8,045	2,452
Qwen3.6 27B	3.0	10.0	0.0%	0		80.99s	204	401	5,807

त्वरित तुलना

तुलना जोड़ी बदलें

Claude Opus 4.6mediumvsStep 3.7 Flashhigh Claude Sonnet 4.6nonevsQwen3.6 27Bmedium Claude Opus 4.6mediumvsGPT-5.3 Chatnone Claude Opus 4.6mediumvsGemini 3.1 Flash Litelow Claude Opus 4.6mediumvsQwen3.6 Max Previewnone Claude Opus 4.6mediumvsGemini 3.1 Flash Lite Previewnone Claude Opus 4.6mediumvsStep 3.7 Flashlow Gemma 4 31Bnoneनिःशुल्क उपलब्धvsQwen3.6 27Bmedium Qwen3.6 27BmediumvsStep 3.7 Flashhigh Claude Opus 4.8nonevsQwen3.6 27Bmedium Gemini 3.1 Flash LiteminimalvsQwen3.6 27Bmedium Gemini 3.1 Flash LitenonevsQwen3.6 27Bmedium