नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Anthropic: Claude Opus 4.8 vs Qwen: Qwen3.5-Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-28

मेट्रिक Claude Opus 4.8 Claude Opus 4.8 none रिलीज़: 2026-05-28 Qwen3.5-Flash Qwen3.5-Flash medium रिलीज़: 2026-02-24
स्कोर 7.3 7.6
रैंक #63 #48
विश्वसनीयता 10.0 10.0
संगति 9.2 8.0
सही परीक्षण
प्रति प्रयास पास दर 65.0% 75.0%
अस्थिर टेस्ट 2 5
कुल रन 60 60
प्रति परिणाम लागत 4.324 0.821
कुल लागत $0.519 $0.074
इनपुट कीमत $5.000 / 1M $0.065 / 1M
आउटपुट कीमत $25.000 / 1M $0.260 / 1M
आउटपुट टोकन 8,098 2,074
रीजनिंग टोकन 0 272,063
प्रतिक्रिया समय (औसत) 3.51s 63.04s
प्रतिक्रिया समय (अधिकतम) 17.73s 234.29s
प्रतिक्रिया समय (कुल) 70.19s 1197.71s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 6.5 10.0 50.0% 0 3.40s 1,472 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 59.11s 383 32,992
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 6.8 10.0 50.0% 0 3.59s 1,323 0
Qwen3.5-Flash 4.1 5.8 33.3% 1 54.23s 288 67,546
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 9.5 10.0 100.0% 0 17.73s 3,259 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 17.78s 483 8,270
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 7.3 5.8 83.3% 1 1.77s 308 0
Qwen3.5-Flash 7.3 5.9 83.3% 1 56.99s 235 16,237
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 5.3 7.2 44.4% 1 1.66s 61 0
Qwen3.5-Flash 5.3 7.2 44.4% 1 146.50s 58 43,615
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.48s 230 0
Qwen3.5-Flash 6.1 3.1 66.7% 1 40.05s 99 38,486
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 9.9 10.0 100.0% 0 1.37s 95 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 63.49s 98 14,139
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 7.7 10.0 66.7% 0 2.74s 783 0
Qwen3.5-Flash 8.2 7.2 88.9% 1 27.61s 89 12,457
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 5.35s 355 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 10.33s 309 1,284
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 3.0 10.0 0.0% 0 3.41s 212 0
Qwen3.5-Flash 3.0 10.0 0.0% 0 48.98s 32 37,037

त्वरित तुलना

तुलना जोड़ी बदलें