नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Anthropic: Claude Opus 4.8 vs Qwen: Qwen3.5-122B-A10B

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-28

मेट्रिक Claude Opus 4.8 Claude Opus 4.8 none रिलीज़: 2026-05-28 Qwen3.5-122B-A10B Qwen3.5-122B-A10B medium रिलीज़: 2026-02-24
स्कोर 7.3 7.7
रैंक #63 #41
विश्वसनीयता 10.0 10.0
संगति 9.2 8.8
सही परीक्षण
प्रति प्रयास पास दर 65.0% 71.7%
अस्थिर टेस्ट 2 3
कुल रन 60 60
प्रति परिणाम लागत 4.324 5.031
कुल लागत $0.519 $0.509
इनपुट कीमत $5.000 / 1M $0.260 / 1M
आउटपुट कीमत $25.000 / 1M $2.080 / 1M
आउटपुट टोकन 8,098 26,166
रीजनिंग टोकन 0 213,524
प्रतिक्रिया समय (औसत) 3.51s 39.40s
प्रतिक्रिया समय (अधिकतम) 17.73s 168.16s
प्रतिक्रिया समय (कुल) 70.19s 788.00s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 6.5 10.0 50.0% 0 3.40s 1,472 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.75s 269 16,835
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 6.8 10.0 50.0% 0 3.59s 1,323 0
Qwen3.5-122B-A10B 4.1 5.8 33.3% 1 119.57s 8,036 45,074
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 9.5 10.0 100.0% 0 17.73s 3,259 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 107.79s 483 11,337
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 7.3 5.8 83.3% 1 1.77s 308 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 23.41s 270 16,558
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 5.3 7.2 44.4% 1 1.66s 61 0
Qwen3.5-122B-A10B 2.9 7.2 11.1% 1 63.40s 15,537 64,889
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.48s 230 0
Qwen3.5-122B-A10B 3.4 2.2 33.3% 1 34.11s 66 7,592
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 9.9 10.0 100.0% 0 1.37s 95 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.88s 77 7,372
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 7.7 10.0 66.7% 0 2.74s 783 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 17.89s 284 27,575
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 5.35s 355 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 4.60s 322 1,226
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 3.0 10.0 0.0% 0 3.41s 212 0
Qwen3.5-122B-A10B 3.0 10.0 0.0% 0 52.87s 822 15,066

त्वरित तुलना

तुलना जोड़ी बदलें