नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Anthropic: Claude Opus 4.6 vs xAI: Grok Build 0.1

सारांश

Claude Opus 4.6 vs Grok Build 0.1 benchmark तुलना: Claude Opus 4.6 average score में आगे है: 7.7 vs 7.6. Grok Build 0.1 की benchmark लागत कम है: $0.927 vs $2.053. Claude Opus 4.6 तेज है: 25.89s vs 49.90s, pass rates 61.9% vs 61.9%.

अनुशंसित मॉडल: Grok Build 0.1 - Its score stays close to the best score here (7.6 vs 7.7), while costing about 2.2x less than Claude Opus 4.6.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-02

मेट्रिक Claude Opus 4.6 Claude Opus 4.6 medium रिलीज़: 2026-02-05 Grok Build 0.1 Grok Build 0.1 medium रिलीज़: 2026-05-21
स्कोर 7.7 7.6
रैंक #40 #44
विश्वसनीयता 10.0 10.0
संगति 8.8 9.9
सही परीक्षण
प्रति प्रयास पास दर 61.9% 61.9%
अस्थिर टेस्ट 3 0
कुल रन 63 63
प्रति परिणाम लागत 17.103 7.124
कुल लागत $2.053 $0.927
इनपुट कीमत $5.000 / 1M $1.000 / 1M
आउटपुट कीमत $25.000 / 1M $2.000 / 1M
कुल इनपुट टोकन 53,227 44,418
आउटपुट टोकन 47,446 2,782
रीजनिंग टोकन 24,000 438,018
प्रतिक्रिया समय (औसत) 25.89s 49.90s
प्रतिक्रिया समय (अधिकतम) 83.40s 252.69s
प्रतिक्रिया समय (कुल) 362.49s 1047.92s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#40 Claude Opus 4.6

medium
अमान्य SVG
लागत
$0.000
समय
300.0s
टोकन
0 tok

#44 xAI: Grok Build 0.1

medium
लागत
$0.028
समय
81.3s
टोकन
14,009 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 840 986 1,071
Grok Build 0.1 8.3 10.0 75.0% 0 7.43s 2,010 220 12,162
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 5.7 7.1 44.4% 1 30.10s 8,522 13,057 4,121
Grok Build 0.1 5.7 9.7 33.3% 0 108.46s 8,304 1,138 161,452
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 20,685 8,178 5,194
Grok Build 0.1 10.0 10.0 100.0% 0 32.81s 12,909 231 16,917
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 8,676 691 757
Grok Build 0.1 10.0 10.0 100.0% 0 10.72s 7,761 180 8,876
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 674 14,642 8,687
Grok Build 0.1 5.3 10.0 33.3% 0 158.00s 1,764 492 175,294
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 564 188 292
Grok Build 0.1 4.4 9.9 0.0% 0 18.41s 825 76 6,345
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 792 266 467
Grok Build 0.1 9.8 10.0 100.0% 0 12.36s 1,362 57 9,599
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 7.7 10.0 66.7% 0 4.71s 816 532 630
Grok Build 0.1 7.7 10.0 66.7% 0 18.26s 1,689 195 20,841
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 11,454 861 329
Grok Build 0.1 10.0 10.0 100.0% 0 13.12s 7,263 180 4,969
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 3.0 10.0 0.0% 0 63.24s 204 8,045 2,452
Grok Build 0.1 3.0 10.0 0.0% 0 53.51s 531 13 21,563

त्वरित तुलना

तुलना जोड़ी बदलें