नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Anthropic: Claude Opus 4.6 vs Qwen: Qwen3.5-Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-29

मेट्रिक Claude Opus 4.6 Claude Opus 4.6 medium रिलीज़: 2026-02-05 Qwen3.5-Flash Qwen3.5-Flash medium रिलीज़: 2026-02-24
स्कोर 7.6 7.8
रैंक #49 #43
विश्वसनीयता लागू नहीं लागू नहीं
संगति 9.1 7.3
सही परीक्षण
प्रति प्रयास पास दर 70.4% 81.5%
अस्थिर टेस्ट 2 6
कुल रन 54 54
प्रति परिणाम लागत 12.047 0.719
कुल लागत $1.446 $0.080
???? ??? $5.000 / 1M $0.065 / 1M
????? ??? $25.000 / 1M $0.260 / 1M
आउटपुट टोकन 29,829 2,073
रीजनिंग टोकन 18,938 191,899
प्रतिक्रिया समय (औसत) 21.08s 66.72s
प्रतिक्रिया समय (अधिकतम) 83.40s 234.29s
प्रतिक्रिया समय (कुल) 231.84s 1201.03s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 986 1,071
Qwen3.5-Flash 10.0 10.0 100.0% 0 59.11s 383 32,992
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 23.11s 3,486 1,504
Qwen3.5-Flash 4.7 1.6 66.7% 1 45.75s 246 12,600
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
Qwen3.5-Flash 10.0 10.0 100.0% 0 17.78s 483 8,270
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 691 757
Qwen3.5-Flash 7.3 5.9 83.3% 1 56.99s 235 16,237
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 14,642 8,687
Qwen3.5-Flash 5.3 7.2 44.4% 1 146.50s 58 43,615
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 188 292
Qwen3.5-Flash 6.1 3.1 66.7% 1 40.05s 99 38,486
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
Qwen3.5-Flash 10.0 10.0 100.0% 0 63.49s 98 14,139
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 7.7 10.0 66.7% 0 4.60s 531 637
Qwen3.5-Flash 6.4 4.4 77.8% 2 56.74s 162 24,276
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
Qwen3.5-Flash 10.0 10.0 100.0% 0 10.33s 309 1,284

त्वरित तुलना

तुलना जोड़ी बदलें