नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Anthropic: Claude Opus 4.8 vs Qwen: Qwen3.6 35B A3B

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-03

मेट्रिक Claude Opus 4.8 Claude Opus 4.8 none रिलीज़: 2026-05-28 Qwen3.6 35B A3B Qwen3.6 35B A3B medium रिलीज़: 2026-04-20
स्कोर 7.3 7.3
रैंक #62 #58
विश्वसनीयता 10.0 10.0
संगति 9.2 9.6
सही परीक्षण
प्रति प्रयास पास दर 65.0% 61.7%
अस्थिर टेस्ट 2 1
कुल रन 60 60
प्रति परिणाम लागत 4.324 1.048
कुल लागत $0.519 $0.130
इनपुट कीमत $5.000 / 1M $0.140 / 1M
आउटपुट कीमत $25.000 / 1M $1.000 / 1M
कुल इनपुट टोकन 63,282 13,550
आउटपुट टोकन 8,098 18,304
रीजनिंग टोकन 0 115,531
प्रतिक्रिया समय (औसत) 3.51s 17.26s
प्रतिक्रिया समय (अधिकतम) 17.73s 86.11s
प्रतिक्रिया समय (कुल) 70.19s 310.65s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 6.5 10.0 50.0% 0 3.40s 834 1,472 0
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 6.02s 672 1,154 12,385
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 6.8 10.0 50.0% 0 3.59s 6,768 1,323 0
Qwen3.6 35B A3B 6.6 10.0 50.0% 0 59.35s 2,216 6,601 22,535
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 9.5 10.0 100.0% 0 17.73s 29,658 3,259 0
Qwen3.6 35B A3B 3.0 10.0 0.0% 0 0ms 0 0 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 7.3 5.8 83.3% 1 1.77s 10,503 308 0
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 12.99s 7,776 2,591 9,968
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 5.3 7.2 44.4% 1 1.66s 975 61 0
Qwen3.6 35B A3B 5.3 7.2 44.4% 1 22.50s 771 6,193 39,116
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.48s 708 230 0
Qwen3.6 35B A3B 4.4 9.9 0.0% 0 8.66s 516 129 4,569
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 9.9 10.0 100.0% 0 1.37s 909 95 0
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 7.50s 699 219 7,404
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 7.7 10.0 66.7% 0 2.74s 894 783 0
Qwen3.6 35B A3B 8.0 10.0 66.7% 0 5.95s 696 655 9,228
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 5.35s 11,775 355 0
Qwen3.6 35B A3B 3.0 10.0 0.0% 0 0ms 0 0 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 3.0 10.0 0.0% 0 3.41s 258 212 0
Qwen3.6 35B A3B 3.0 10.0 0.0% 0 32.90s 204 762 10,326

त्वरित तुलना

तुलना जोड़ी बदलें