नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

HY3 Preview vs Grok 4.20 Beta

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-26

मेट्रिक HY3 Preview HY3 Preview high रिलीज़: 2026-04-22 निःशुल्क उपलब्ध Grok 4.20 Beta Grok 4.20 Beta medium रिलीज़: 2026-03-12
स्कोर 8.5 8.0
रैंक #11 #31
विश्वसनीयता लागू नहीं लागू नहीं
संगति 8.8 9.1
सही परीक्षण
प्रति प्रयास पास दर 81.5% 74.1%
अस्थिर टेस्ट 3 2
कुल रन 50 52
प्रति परिणाम लागत 0.000 5.269
कुल लागत $0.000 $0.633
???? ??? $0.000 / 1M $0.000 / 1M
????? ??? $0.000 / 1M $0.000 / 1M
आउटपुट टोकन 238,920 1,568
रीजनिंग टोकन 0 91,909
प्रतिक्रिया समय (औसत) 55.19s 9.81s
प्रतिक्रिया समय (अधिकतम) 149.94s 31.36s
प्रतिक्रिया समय (कुल) 938.23s 176.62s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
HY3 Preview 10.0 10.0 100.0% 0 32.69s 26,550 0
Grok 4.20 Beta 8.7 7.9 91.7% 1 3.16s 268 7,583
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
HY3 Preview 10.0 10.0 100.0% 0 99.76s 38,167 0
Grok 4.20 Beta 10.0 10.0 100.0% 0 31.36s 81 3,987
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
HY3 Preview 10.0 10.0 100.0% 0 113.09s 31,319 0
Grok 4.20 Beta 10.0 10.0 100.0% 0 20.93s 227 12,212
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
HY3 Preview 6.5 10.0 50.0% 0 12.11s 4,323 0
Grok 4.20 Beta 10.0 10.0 100.0% 0 4.01s 180 5,281
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
HY3 Preview 5.3 7.2 44.4% 1 109.04s 87,559 0
Grok 4.20 Beta 5.3 10.0 33.3% 0 21.33s 251 40,255
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
HY3 Preview 10.0 10.0 100.0% 0 24.31s 5,490 0
Grok 4.20 Beta 10.0 10.0 100.0% 0 5.78s 72 3,440
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
HY3 Preview 8.5 6.8 83.3% 1 34.02s 13,331 0
Grok 4.20 Beta 8.3 10.0 50.0% 0 4.97s 57 7,107
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
HY3 Preview 9.0 7.9 88.9% 1 28.07s 21,811 0
Grok 4.20 Beta 8.2 7.2 88.9% 1 3.85s 249 6,660
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
HY3 Preview 10.0 10.0 100.0% 0 78.83s 10,370 0
Grok 4.20 Beta 3.0 10.0 0.0% 0 12.39s 183 5,384

त्वरित तुलना

तुलना जोड़ी बदलें