नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

HY3 Preview vs xAI: Grok 4.3

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-01

मेट्रिक HY3 Preview HY3 Preview low रिलीज़: 2026-04-22 निःशुल्क उपलब्ध Grok 4.3 Grok 4.3 medium रिलीज़: 2026-05-01
स्कोर 8.1 8.2
रैंक #29 #20
विश्वसनीयता लागू नहीं 10.0
संगति 9.5 8.6
सही परीक्षण
प्रति प्रयास पास दर 75.9% 81.5%
अस्थिर टेस्ट 1 3
कुल रन 50 54
प्रति परिणाम लागत 0.000 3.974
कुल लागत $0.000 $0.517
???? ??? $0.000 / 1M $1.250 / 1M
????? ??? $0.000 / 1M $2.500 / 1M
आउटपुट टोकन 65,778 1,223
रीजनिंग टोकन 0 187,047
प्रतिक्रिया समय (औसत) 23.98s 48.63s
प्रतिक्रिया समय (अधिकतम) 78.74s 216.69s
प्रतिक्रिया समय (कुल) 407.72s 875.27s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
HY3 Preview 10.0 10.0 100.0% 0 16.61s 7,905 0
Grok 4.3 10.0 10.0 100.0% 0 8.83s 88 8,207
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
HY3 Preview 10.0 10.0 100.0% 0 27.94s 7,907 0
Grok 4.3 10.0 10.0 100.0% 0 45.72s 284 9,659
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
HY3 Preview 10.0 10.0 100.0% 0 78.74s 12,975 0
Grok 4.3 10.0 10.0 100.0% 0 63.99s 234 15,301
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
HY3 Preview 6.5 10.0 50.0% 0 5.85s 1,022 0
Grok 4.3 10.0 10.0 100.0% 0 18.97s 180 9,546
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
HY3 Preview 5.9 7.2 55.6% 1 40.44s 23,121 0
Grok 4.3 5.3 7.2 44.4% 1 181.74s 14 111,300
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
HY3 Preview 10.0 10.0 100.0% 0 16.44s 2,185 0
Grok 4.3 5.4 2.5 66.7% 1 24.70s 70 5,020
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
HY3 Preview 10.0 10.0 100.0% 0 15.98s 2,475 0
Grok 4.3 9.8 10.0 100.0% 0 18.58s 57 8,713
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
HY3 Preview 5.3 10.0 33.3% 0 13.73s 6,985 0
Grok 4.3 5.9 7.2 55.6% 1 22.53s 128 14,686
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
HY3 Preview 10.0 10.0 100.0% 0 17.84s 1,203 0
Grok 4.3 10.0 10.0 100.0% 0 17.66s 168 4,615

त्वरित तुलना

तुलना जोड़ी बदलें