नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Anthropic: Claude Opus 4.6 vs HY3 Preview

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-24

मेट्रिक Claude Opus 4.6 Claude Opus 4.6 medium रिलीज़: 2026-02-05 HY3 Preview HY3 Preview low रिलीज़: 2026-04-22 निःशुल्क उपलब्ध
स्कोर 7.6 8.1
रैंक #45 #24
विश्वसनीयता लागू नहीं लागू नहीं
संगति 9.1 9.5
सही परीक्षण
प्रति प्रयास पास दर 70.4% 75.9%
अस्थिर टेस्ट 2 1
कुल रन 54 50
प्रति परिणाम लागत 12.047 0.000
कुल लागत $1.446 $0.000
???? ??? $5.000 / 1M $0.000 / 1M
????? ??? $25.000 / 1M $0.000 / 1M
आउटपुट टोकन 29,829 65,778
रीजनिंग टोकन 18,938 0
प्रतिक्रिया समय (औसत) 21.08s 23.98s
प्रतिक्रिया समय (अधिकतम) 83.40s 78.74s
प्रतिक्रिया समय (कुल) 231.84s 407.72s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 986 1,071
HY3 Preview 10.0 10.0 100.0% 0 16.61s 7,905 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 23.11s 3,486 1,504
HY3 Preview 10.0 10.0 100.0% 0 27.94s 7,907 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
HY3 Preview 10.0 10.0 100.0% 0 78.74s 12,975 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 691 757
HY3 Preview 6.5 10.0 50.0% 0 5.85s 1,022 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 14,642 8,687
HY3 Preview 5.9 7.2 55.6% 1 40.44s 23,121 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 188 292
HY3 Preview 10.0 10.0 100.0% 0 16.44s 2,185 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
HY3 Preview 10.0 10.0 100.0% 0 15.98s 2,475 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 7.7 10.0 66.7% 0 4.60s 531 637
HY3 Preview 5.3 10.0 33.3% 0 13.73s 6,985 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
HY3 Preview 10.0 10.0 100.0% 0 17.84s 1,203 0

त्वरित तुलना

तुलना जोड़ी बदलें