Anthropic: Claude Opus 4.8 vs Qwen: Qwen3.5-27B

Qwen3.5-27B (medium) average score मध्ये पुढे आहे: 7.4 vs 7.3. Claude Opus 4.8 चा benchmark खर्च कमी आहे: $1.166 vs $1.627. Claude Opus 4.8 वेगवान आहे: 4.91s vs 111.94s, pass rates 63.6% vs 72.7%.

शिफारस केलेले मॉडेलClaude Opus 4.8Its score stays close to the best score here (7.3 vs 7.4), while responding about 22.8x faster than Qwen3.5-27B (medium).

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-07-18

मेट्रिक	Claude Opus 4.8 Claude Opus 4.8 none प्रकाशन: 2026-05-28	Qwen3.5-27B Qwen3.5-27B medium प्रकाशन: 2026-02-24

मेट्रिक	Claude Opus 4.8 Claude Opus 4.8 none प्रकाशन: 2026-05-28	Qwen3.5-27B Qwen3.5-27B medium प्रकाशन: 2026-02-24
स्कोअर	7.3	7.4
क्रमांक	#65	#58
विश्वसनीयता	10.0	10.0
सुसंगतता	9.2	8.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर	63.6%	72.7%
अस्थिर चाचण्या	2	5
एकूण रन	66	66
प्रति निकाल खर्च	8.969	8.324
एकूण खर्च	$1.166	$1.627
इनपुट किंमत	$5.000 / 1M	$0.260 / 1M
आउटपुट किंमत	$25.000 / 1M	$2.600 / 1M
एकूण इनपुट टोकन्स	149,206	111,635
आउटपुट टोकन्स	16,797	15,999
रिझनिंग टोकन्स	0	598,430
प्रतिसाद वेळ (सरासरी)	4.91s	111.94s
प्रतिसाद वेळ (कमाल)	35.03s	1026.43s
प्रतिसाद वेळ (एकूण)	108.03s	2462.67s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#65 Claude Opus 4.8

none

खर्च: $0.053
वेळ: 22.0s
टोकन्स: 2,253 tok

#58 Qwen3.5-27B

medium

खर्च: $0.008
वेळ: 62.0s
टोकन्स: 3,099 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

श्रेणी:

अँटी-एआय युक्त्या	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	इनपुट टोकन्स	आउटपुट टोकन्स	रिझनिंग टोकन्स
Claude Opus 4.8	6.5	10.0	50.0%	0		3.40s	834	1,472	0
Qwen3.5-27B	8.7	7.9	91.7%	1		19.75s	672	569	31,505

कोडिंग	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	इनपुट टोकन्स	आउटपुट टोकन्स	रिझनिंग टोकन्स
Claude Opus 4.8	5.5	10.0	33.3%	0		3.29s	10,590	1,332	0
Qwen3.5-27B	6.2	7.1	55.6%	1		160.69s	7,895	6,381	89,388

संयुक्त	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	इनपुट टोकन्स	आउटपुट टोकन्स	रिझनिंग टोकन्स
Claude Opus 4.8	9.8	10.0	100.0%	0		26.38s	111,760	11,949	0
Qwen3.5-27B	7.3	5.8	83.3%	1		595.19s	84,417	7,948	279,132

डेटा पार्सिंग आणि निष्कर्षण	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	इनपुट टोकन्स	आउटपुट टोकन्स	रिझनिंग टोकन्स
Claude Opus 4.8	7.3	5.8	83.3%	1		1.77s	10,503	308	0
Qwen3.5-27B	10.0	10.0	100.0%	0		30.26s	7,782	270	16,150

डोमेन-विशिष्ट	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	इनपुट टोकन्स	आउटपुट टोकन्स	रिझनिंग टोकन्स
Claude Opus 4.8	5.3	7.2	44.4%	1		1.70s	975	61	0
Qwen3.5-27B	5.3	10.0	33.3%	0		79.53s	553	43	52,368

Samanya Buddhimatta	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	इनपुट टोकन्स	आउटपुट टोकन्स	रिझनिंग टोकन्स
Claude Opus 4.8	10.0	10.0	100.0%	0		3.48s	708	230	0
Qwen3.5-27B	6.1	3.1	66.7%	1		101.41s	524	70	23,147

सूचनांचे पालन	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	इनपुट टोकन्स	आउटपुट टोकन्स	रिझनिंग टोकन्स
Claude Opus 4.8	9.9	10.0	100.0%	0		1.37s	909	95	0
Qwen3.5-27B	10.0	10.0	100.0%	0		19.66s	699	97	11,638

कोडी सोडवणे	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	इनपुट टोकन्स	आउटपुट टोकन्स	रिझनिंग टोकन्स
Claude Opus 4.8	7.7	10.0	66.7%	0		2.74s	894	783	0
Qwen3.5-27B	8.2	7.7	77.8%	1		59.60s	696	242	70,096

टूल कॉलिंग	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	इनपुट टोकन्स	आउटपुट टोकन्स	रिझनिंग टोकन्स
Claude Opus 4.8	10.0	10.0	100.0%	0		5.35s	11,775	355	0
Qwen3.5-27B	10.0	10.0	100.0%	0		7.45s	8,193	348	1,323

सामान्य ज्ञान	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	इनपुट टोकन्स	आउटपुट टोकन्स	रिझनिंग टोकन्स
Claude Opus 4.8	3.0	10.0	0.0%	0		3.41s	258	212	0
Qwen3.5-27B	3.0	10.0	0.0%	0		85.11s	204	31	23,683

झटपट तुलना

तुलना जोडी बदला

Claude Opus 4.8nonevsStep 3.7 Flashlow Claude Opus 4.8nonevsKimi K2.6medium Claude Opus 4.8nonevsGemini 3.1 Flash Litemedium Claude Opus 4.8nonevsKAT-Coder-Pro V2.5high GPT-5.6 TerralowvsQwen3.5-27Bmedium Claude Opus 4.8nonevsGemini 3.1 Flash Lite Previewmedium GPT-5.3 ChatnonevsQwen3.5-27Bmedium Gemini 3 Flash PreviewlowvsQwen3.5-27Bmedium KAT-Coder-Pro V2.5lowvsQwen3.5-27Bmedium Claude Opus 4.8nonevsQwen3.5 Plus 2026-04-20medium Claude Sonnet 4.6nonevsQwen3.5-27Bmedium Claude Opus 4.8nonevsKAT-Coder-Pro V2.5low