नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Anthropic: Claude Sonnet 4.6 vs Qwen: Qwen3.5-Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-14

मेट्रिक Claude Sonnet 4.6 Claude Sonnet 4.6 none रिलीज़: 2026-02-17 Qwen3.5-Flash Qwen3.5-Flash medium रिलीज़: 2026-02-24
स्कोर 7.4 7.8
रैंक #39 #30
संगति 9.6 7.3
सही परीक्षण
प्रति प्रयास पास दर 64.8% 81.5%
अस्थिर टेस्ट 1 6
कुल रन 54 54
प्रति परिणाम लागत 2.376 0.719
कुल लागत $0.262 $0.080
???? ??? $3.000 / 1M $0.065 / 1M
????? ??? $15.000 / 1M $0.260 / 1M
आउटपुट टोकन 7,433 2,073
रीजनिंग टोकन 0 191,899
प्रतिक्रिया समय (औसत) 4.98s 66.72s
प्रतिक्रिया समय (अधिकतम) 23.84s 234.29s
प्रतिक्रिया समय (कुल) 54.83s 1201.03s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 1,214 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 59.11s 383 32,992
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.67s 523 0
Qwen3.5-Flash 4.7 1.6 66.7% 1 45.75s 246 12,600
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 3,766 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 17.78s 483 8,270
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 252 0
Qwen3.5-Flash 7.3 5.9 83.3% 1 56.99s 235 16,237
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 413 0
Qwen3.5-Flash 5.3 7.2 44.4% 1 146.50s 58 43,615
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 192 0
Qwen3.5-Flash 6.1 3.1 66.7% 1 40.05s 99 38,486
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 90 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 63.49s 98 14,139
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.92s 536 0
Qwen3.5-Flash 6.4 4.4 77.8% 2 56.74s 162 24,276
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 447 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 10.33s 309 1,284

त्वरित तुलना

तुलना जोड़ी बदलें