नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Anthropic: Claude Opus 4.7 vs Qwen: Qwen3.5-122B-A10B

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-16

मेट्रिक Claude Opus 4.7 Claude Opus 4.7 medium रिलीज़: 2026-04-16 Qwen3.5-122B-A10B Qwen3.5-122B-A10B medium रिलीज़: 2026-02-24
स्कोर 9.2 8.1
रैंक #3 #19
संगति 10.0 8.6
सही परीक्षण
प्रति प्रयास पास दर 88.9% 79.6%
अस्थिर टेस्ट 0 3
कुल रन 54 54
प्रति परिणाम लागत 2.790 4.060
कुल लागत $0.447 $0.528
???? ??? $5.000 / 1M $0.260 / 1M
????? ??? $25.000 / 1M $2.080 / 1M
आउटपुट टोकन 5,375 17,635
रीजनिंग टोकन 1,341 162,668
प्रतिक्रिया समय (औसत) 3.53s 31.38s
प्रतिक्रिया समय (अधिकतम) 21.45s 119.29s
प्रतिक्रिया समय (कुल) 60.03s 564.84s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 8.3 10.0 75.0% 0 1.85s 348 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.75s 269 16,835
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 6.41s 1,141 257
Qwen3.5-122B-A10B 4.7 1.6 66.7% 1 70.98s 322 10,694
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 21.45s 2,369 1,084
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 107.79s 483 11,337
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.37s 324 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 23.41s 270 16,558
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 7.7 10.0 66.7% 0 1.17s 51 0
Qwen3.5-122B-A10B 2.9 7.2 11.1% 1 63.40s 15,537 64,889
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.87s 256 0
Qwen3.5-122B-A10B 3.4 2.2 33.3% 1 34.11s 66 7,592
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 1.57s 114 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.88s 77 7,372
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.51s 399 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 17.18s 289 26,165
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 4.17s 373 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 4.60s 322 1,226

त्वरित तुलना

तुलना जोड़ी बदलें