नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Anthropic: Claude Opus 4.7 vs Qwen: Qwen3.6 Max Preview

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-27

मेट्रिक Claude Opus 4.7 Claude Opus 4.7 medium रिलीज़: 2026-04-16 Qwen3.6 Max Preview Qwen3.6 Max Preview medium रिलीज़: 2026-04-20
स्कोर 9.2 8.8
रैंक #3 #8
विश्वसनीयता लागू नहीं 10.0
संगति 10.0 9.5
सही परीक्षण
प्रति प्रयास पास दर 88.9% 85.2%
अस्थिर टेस्ट 0 1
कुल रन 54 54
प्रति परिणाम लागत 2.790 5.486
कुल लागत $0.447 $0.823
???? ??? $5.000 / 1M $1.300 / 1M
????? ??? $25.000 / 1M $7.800 / 1M
आउटपुट टोकन 5,375 2,158
रीजनिंग टोकन 1,341 97,495
प्रतिक्रिया समय (औसत) 3.53s 48.31s
प्रतिक्रिया समय (अधिकतम) 21.45s 186.74s
प्रतिक्रिया समय (कुल) 60.03s 869.64s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 8.3 10.0 75.0% 0 1.85s 348 0
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 22.13s 228 10,075
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 6.41s 1,141 257
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 117.87s 368 13,790
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 21.45s 2,369 1,084
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 121.49s 390 14,575
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.37s 324 0
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 41.15s 270 10,106
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 7.7 10.0 66.7% 0 1.17s 51 0
Qwen3.6 Max Preview 2.9 7.2 11.1% 1 95.91s 60 30,371
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.87s 256 0
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 32.24s 129 3,510
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 1.57s 114 0
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 24.31s 103 5,848
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.51s 399 0
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 24.19s 301 7,649
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 4.17s 373 0
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 18.32s 309 1,571

त्वरित तुलना

तुलना जोड़ी बदलें