Anthropic: Claude Opus 4.8 vs Qwen: Qwen3.5-122B-A10B

Claude Opus 4.8 average score मध्ये पुढे आहे: 7.3 vs 7.1. Qwen3.5-122B-A10B (medium) चा benchmark खर्च कमी आहे: $1.046 vs $1.166. Claude Opus 4.8 वेगवान आहे: 4.91s vs 64.16s, pass rates 63.6% vs 71.2%.

शिफारस केलेले मॉडेलClaude Opus 4.8It has the best score here (7.3), while responding about 13.1x faster than Qwen3.5-122B-A10B (medium).

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-07-17

मेट्रिक	Claude Opus 4.8 Claude Opus 4.8 none प्रकाशन: 2026-05-28	Qwen3.5-122B-A10B Qwen3.5-122B-A10B medium प्रकाशन: 2026-02-24

मेट्रिक	Claude Opus 4.8 Claude Opus 4.8 none प्रकाशन: 2026-05-28	Qwen3.5-122B-A10B Qwen3.5-122B-A10B medium प्रकाशन: 2026-02-24
स्कोअर	7.3	7.1
क्रमांक	#63	#69
विश्वसनीयता	10.0	10.0
सुसंगतता	9.2	8.5
बरोबर चाचण्या
प्रति प्रयत्न पास दर	63.6%	71.2%
अस्थिर चाचण्या	2	4
एकूण रन	66	66
प्रति निकाल खर्च	8.969	8.509
एकूण खर्च	$1.166	$1.046
इनपुट किंमत	$5.000 / 1M	$0.260 / 1M
आउटपुट किंमत	$25.000 / 1M	$2.080 / 1M
एकूण इनपुट टोकन्स	149,206	124,771
आउटपुट टोकन्स	16,797	44,077
रिझनिंग टोकन्स	0	443,141
प्रतिसाद वेळ (सरासरी)	4.91s	64.16s
प्रतिसाद वेळ (कमाल)	35.03s	519.30s
प्रतिसाद वेळ (एकूण)	108.03s	1411.60s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#63 Claude Opus 4.8

none

खर्च: $0.053
वेळ: 22.0s
टोकन्स: 2,253 tok

#69 Qwen3.5-122B-A10B

medium

खर्च: $0.019
वेळ: 48.7s
टोकन्स: 6,034 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

श्रेणी:

अँटी-एआय युक्त्या	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	इनपुट टोकन्स	आउटपुट टोकन्स	रिझनिंग टोकन्स
Claude Opus 4.8	6.5	10.0	50.0%	0		3.40s	834	1,472	0
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		9.75s	672	269	16,835

कोडिंग	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	इनपुट टोकन्स	आउटपुट टोकन्स	रिझनिंग टोकन्स
Claude Opus 4.8	5.5	10.0	33.3%	0		3.29s	10,590	1,332	0
Qwen3.5-122B-A10B	6.0	7.2	55.6%	1		114.48s	7,630	8,057	82,578

संयुक्त	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	इनपुट टोकन्स	आउटपुट टोकन्स	रिझनिंग टोकन्स
Claude Opus 4.8	9.8	10.0	100.0%	0		26.38s	111,760	11,949	0
Qwen3.5-122B-A10B	6.4	5.8	66.7%	1		313.55s	97,886	18,373	203,450

डेटा पार्सिंग आणि निष्कर्षण	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	इनपुट टोकन्स	आउटपुट टोकन्स	रिझनिंग टोकन्स
Claude Opus 4.8	7.3	5.8	83.3%	1		1.77s	10,503	308	0
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		23.41s	7,782	270	16,558

डोमेन-विशिष्ट	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	इनपुट टोकन्स	आउटपुट टोकन्स	रिझनिंग टोकन्स
Claude Opus 4.8	5.3	7.2	44.4%	1		1.70s	975	61	0
Qwen3.5-122B-A10B	2.9	7.2	11.1%	1		63.40s	771	15,537	64,889

Samanya Buddhimatta	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	इनपुट टोकन्स	आउटपुट टोकन्स	रिझनिंग टोकन्स
Claude Opus 4.8	10.0	10.0	100.0%	0		3.48s	708	230	0
Qwen3.5-122B-A10B	3.4	2.2	33.3%	1		34.11s	344	66	7,592

सूचनांचे पालन	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	इनपुट टोकन्स	आउटपुट टोकन्स	रिझनिंग टोकन्स
Claude Opus 4.8	9.9	10.0	100.0%	0		1.37s	909	95	0
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		9.88s	593	77	7,372

कोडी सोडवणे	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	इनपुट टोकन्स	आउटपुट टोकन्स	रिझनिंग टोकन्स
Claude Opus 4.8	7.7	10.0	66.7%	0		2.74s	894	783	0
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		17.89s	696	284	27,575

टूल कॉलिंग	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	इनपुट टोकन्स	आउटपुट टोकन्स	रिझनिंग टोकन्स
Claude Opus 4.8	10.0	10.0	100.0%	0		5.35s	11,775	355	0
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		4.60s	8,193	322	1,226

सामान्य ज्ञान	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	इनपुट टोकन्स	आउटपुट टोकन्स	रिझनिंग टोकन्स
Claude Opus 4.8	3.0	10.0	0.0%	0		3.41s	258	212	0
Qwen3.5-122B-A10B	3.0	10.0	0.0%	0		52.87s	204	822	15,066

झटपट तुलना

तुलना जोडी बदला