नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Anthropic: Claude Opus 4.8 vs Qwen: Qwen3.6 27B

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-04

मेट्रिक Claude Opus 4.8 Claude Opus 4.8 none रिलीज़: 2026-05-28 Qwen3.6 27B Qwen3.6 27B medium रिलीज़: 2026-04-20
स्कोर 7.0 6.8
रैंक #68 #78
विश्वसनीयता 10.0 10.0
संगति 9.2 8.2
सही परीक्षण
प्रति प्रयास पास दर 61.9% 60.3%
अस्थिर टेस्ट 2 5
कुल रन 63 63
प्रति परिणाम लागत 4.485 3.361
कुल लागत $0.539 $0.444
इनपुट कीमत $5.000 / 1M $0.290 / 1M
आउटपुट कीमत $25.000 / 1M $3.200 / 1M
कुल इनपुट टोकन 67,104 39,376
आउटपुट टोकन 8,107 16,189
रीजनिंग टोकन 0 122,521
प्रतिक्रिया समय (औसत) 3.47s 59.71s
प्रतिक्रिया समय (अधिकतम) 17.73s 168.22s
प्रतिक्रिया समय (कुल) 72.90s 1254.01s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 6.5 10.0 50.0% 0 3.40s 834 1,472 0
Qwen3.6 27B 8.3 10.0 75.0% 0 12.62s 453 582 4,311
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 5.5 10.0 33.3% 0 3.29s 10,590 1,332 0
Qwen3.6 27B 7.7 10.0 66.7% 0 142.99s 5,051 7,968 43,367
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 9.5 10.0 100.0% 0 17.73s 29,658 3,259 0
Qwen3.6 27B 7.0 3.7 66.7% 1 83.07s 15,104 2,088 14,689
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 7.3 5.8 83.3% 1 1.77s 10,503 308 0
Qwen3.6 27B 3.5 1.4 50.0% 2 37.30s 7,778 568 9,404
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 5.3 7.2 44.4% 1 1.66s 975 61 0
Qwen3.6 27B 2.9 7.2 11.1% 1 73.38s 662 3,510 20,352
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.48s 708 230 0
Qwen3.6 27B 6.5 3.4 66.7% 1 39.53s 516 81 3,045
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 9.9 10.0 100.0% 0 1.37s 909 95 0
Qwen3.6 27B 10.0 10.0 100.0% 0 37.96s 699 346 6,548
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 7.7 10.0 66.7% 0 2.74s 894 783 0
Qwen3.6 27B 7.7 10.0 66.7% 0 61.14s 696 255 12,044
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 5.35s 11,775 355 0
Qwen3.6 27B 10.0 10.0 100.0% 0 16.88s 8,213 390 2,954
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 3.0 10.0 0.0% 0 3.41s 258 212 0
Qwen3.6 27B 3.0 10.0 0.0% 0 80.99s 204 401 5,807

त्वरित तुलना

तुलना जोड़ी बदलें