नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Anthropic: Claude Opus 4.7 vs Qwen: Qwen3.7 Plus

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-03

मेट्रिक Claude Opus 4.7 Claude Opus 4.7 medium रिलीज़: 2026-04-16 Qwen3.7 Plus Qwen3.7 Plus medium रिलीज़: 2026-06-03
स्कोर 8.9 8.4
रैंक #7 #16
विश्वसनीयता 10.0 9.9
संगति 10.0 9.2
सही परीक्षण
प्रति प्रयास पास दर 85.0% 80.0%
अस्थिर टेस्ट 0 2
कुल रन 60 60
प्रति परिणाम लागत 3.670 1.324
कुल लागत $0.624 $0.199
इनपुट कीमत $5.000 / 1M $0.400 / 1M
आउटपुट कीमत $25.000 / 1M $1.600 / 1M
कुल इनपुट टोकन 61,569 38,104
आउटपुट टोकन 10,439 2,107
रीजनिंग टोकन 2,198 112,479
प्रतिक्रिया समय (औसत) 4.48s 36.84s
प्रतिक्रिया समय (अधिकतम) 23.18s 178.04s
प्रतिक्रिया समय (कुल) 85.21s 736.86s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 8.3 10.0 75.0% 0 1.85s 894 348 0
Qwen3.7 Plus 10.0 10.0 100.0% 0 8.58s 672 195 5,065
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 14.79s 6,798 6,210 1,114
Qwen3.7 Plus 6.5 5.9 66.7% 1 122.40s 3,637 396 30,301
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 21.45s 24,501 2,369 1,084
Qwen3.7 Plus 10.0 10.0 100.0% 0 65.24s 14,934 366 10,132
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.37s 10,533 324 0
Qwen3.7 Plus 10.0 10.0 100.0% 0 21.75s 7,782 270 6,713
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 7.7 10.0 66.7% 0 1.17s 630 51 0
Qwen3.7 Plus 3.6 7.2 22.2% 1 45.35s 771 57 27,073
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.87s 723 256 0
Qwen3.7 Plus 10.0 10.0 100.0% 0 25.48s 516 123 3,998
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 1.57s 939 114 0
Qwen3.7 Plus 10.0 10.0 100.0% 0 16.13s 699 102 5,013
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.43s 939 370 0
Qwen3.7 Plus 10.0 10.0 100.0% 0 16.38s 696 280 7,312
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 4.17s 15,339 373 0
Qwen3.7 Plus 10.0 10.0 100.0% 0 15.02s 8,193 292 1,831
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 3.0 10.0 0.0% 0 2.25s 273 24 0
Qwen3.7 Plus 3.0 10.0 0.0% 0 91.07s 204 26 15,041

त्वरित तुलना

तुलना जोड़ी बदलें