नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Anthropic: Claude Opus 4.7 vs Qwen: Qwen3.6 Max Preview

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-27

मेट्रिक Claude Opus 4.7 Claude Opus 4.7 none रिलीज़: 2026-04-16 Qwen3.6 Max Preview Qwen3.6 Max Preview medium रिलीज़: 2026-04-20
स्कोर 9.2 8.8
रैंक #4 #8
विश्वसनीयता लागू नहीं 10.0
संगति 10.0 9.5
सही परीक्षण
प्रति प्रयास पास दर 88.9% 85.2%
अस्थिर टेस्ट 0 1
कुल रन 54 54
प्रति परिणाम लागत 3.155 5.486
कुल लागत $0.505 $0.823
???? ??? $5.000 / 1M $1.300 / 1M
????? ??? $25.000 / 1M $7.800 / 1M
आउटपुट टोकन 6,326 2,158
रीजनिंग टोकन 0 97,495
प्रतिक्रिया समय (औसत) 3.13s 48.31s
प्रतिक्रिया समय (अधिकतम) 18.27s 186.74s
प्रतिक्रिया समय (कुल) 56.33s 869.64s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 8.3 10.0 75.0% 0 2.12s 522 0
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 22.13s 228 10,075
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.84s 494 0
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 117.87s 368 13,790
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 9.5 10.0 100.0% 0 18.27s 3,504 0
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 121.49s 390 14,575
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.15s 324 0
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 41.15s 270 10,106
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 7.7 10.0 66.7% 0 1.19s 78 0
Qwen3.6 Max Preview 2.9 7.2 11.1% 1 95.91s 60 30,371
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 3.47s 257 0
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 32.24s 129 3,510
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 1.46s 114 0
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 24.31s 103 5,848
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.58s 661 0
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 24.19s 301 7,649
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 4.74s 372 0
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 18.32s 309 1,571

त्वरित तुलना

तुलना जोड़ी बदलें