नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Anthropic: Claude Opus 4.6 vs Qwen: Qwen3.6 27B

सारांश

Claude Opus 4.6 vs Qwen3.6 27B benchmark तुलना: Claude Opus 4.6 average score में आगे है: 7.0 vs 6.8. Qwen3.6 27B की benchmark लागत कम है: $0.336 vs $2.053. Claude Opus 4.6 तेज है: 25.89s vs 59.71s, pass rates 61.9% vs 60.3%.

अनुशंसित मॉडल: Qwen3.6 27B - Its score stays close to the best score here (6.8 vs 7.0), while costing about 6.1x less than Claude Opus 4.6.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-10

मेट्रिक Claude Opus 4.6 Claude Opus 4.6 medium रिलीज़: 2026-02-05 Qwen3.6 27B Qwen3.6 27B medium रिलीज़: 2026-04-20
स्कोर 7.0 6.8
रैंक #70 #79
विश्वसनीयता 10.0 10.0
संगति 8.8 8.2
सही परीक्षण
प्रति प्रयास पास दर 61.9% 60.3%
अस्थिर टेस्ट 3 5
कुल रन 63 63
प्रति परिणाम लागत 17.103 3.361
कुल लागत $2.053 $0.336
इनपुट कीमत $5.000 / 1M $0.290 / 1M
आउटपुट कीमत $25.000 / 1M $2.400 / 1M
कुल इनपुट टोकन 53,227 39,376
आउटपुट टोकन 47,446 16,189
रीजनिंग टोकन 24,000 122,521
प्रतिक्रिया समय (औसत) 25.89s 59.71s
प्रतिक्रिया समय (अधिकतम) 83.40s 168.22s
प्रतिक्रिया समय (कुल) 362.49s 1254.01s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#70 Claude Opus 4.6

medium
Invalid SVG
Cost
$0.000
Time
300.0s
Tokens
0 tok

#79 Qwen3.6 27B

medium
Cost
$0.009
Time
39.6s
Tokens
3,090 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 840 986 1,071
Qwen3.6 27B 8.3 10.0 75.0% 0 12.62s 453 582 4,311
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 5.7 7.1 44.4% 1 30.10s 8,522 13,057 4,121
Qwen3.6 27B 7.7 10.0 66.7% 0 142.99s 5,051 7,968 43,367
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 20,685 8,178 5,194
Qwen3.6 27B 7.0 3.7 66.7% 1 83.07s 15,104 2,088 14,689
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 8,676 691 757
Qwen3.6 27B 3.5 1.4 50.0% 2 37.30s 7,778 568 9,404
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 674 14,642 8,687
Qwen3.6 27B 2.9 7.2 11.1% 1 73.38s 662 3,510 20,352
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 564 188 292
Qwen3.6 27B 6.5 3.4 66.7% 1 39.53s 516 81 3,045
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 792 266 467
Qwen3.6 27B 10.0 10.0 100.0% 0 37.96s 699 346 6,548
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 7.7 10.0 66.7% 0 4.71s 816 532 630
Qwen3.6 27B 7.7 10.0 66.7% 0 61.14s 696 255 12,044
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 11,454 861 329
Qwen3.6 27B 10.0 10.0 100.0% 0 16.88s 8,213 390 2,954
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 3.0 10.0 0.0% 0 63.24s 204 8,045 2,452
Qwen3.6 27B 3.0 10.0 0.0% 0 80.99s 204 401 5,807

त्वरित तुलना

तुलना जोड़ी बदलें