नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

HY3 Preview vs Grok 4.20 Beta

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-26

मेट्रिक HY3 Preview HY3 Preview high रिलीज़: 2026-04-22 निःशुल्क उपलब्ध Grok 4.20 Beta Grok 4.20 Beta none रिलीज़: 2026-03-12
स्कोर 8.5 5.3
रैंक #11 #93
विश्वसनीयता लागू नहीं लागू नहीं
संगति 8.8 9.2
सही परीक्षण
प्रति प्रयास पास दर 81.5% 29.6%
अस्थिर टेस्ट 3 2
कुल रन 50 52
प्रति परिणाम लागत 0.000 2.255
कुल लागत $0.000 $0.091
???? ??? $0.000 / 1M $0.000 / 1M
????? ??? $0.000 / 1M $0.000 / 1M
आउटपुट टोकन 238,920 1,591
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 55.19s 1.19s
प्रतिक्रिया समय (अधिकतम) 149.94s 6.48s
प्रतिक्रिया समय (कुल) 938.23s 21.37s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
HY3 Preview 10.0 10.0 100.0% 0 32.69s 26,550 0
Grok 4.20 Beta 4.0 8.4 16.7% 1 597ms 251 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
HY3 Preview 10.0 10.0 100.0% 0 99.76s 38,167 0
Grok 4.20 Beta 5.5 10.0 0.0% 0 1.14s 74 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
HY3 Preview 10.0 10.0 100.0% 0 113.09s 31,319 0
Grok 4.20 Beta 3.0 10.0 0.0% 0 6.48s 282 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
HY3 Preview 6.5 10.0 50.0% 0 12.11s 4,323 0
Grok 4.20 Beta 10.0 10.0 100.0% 0 601ms 197 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
HY3 Preview 5.3 7.2 44.4% 1 109.04s 87,559 0
Grok 4.20 Beta 3.0 10.0 0.0% 0 611ms 160 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
HY3 Preview 10.0 10.0 100.0% 0 24.31s 5,490 0
Grok 4.20 Beta 5.0 10.0 0.0% 0 541ms 87 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
HY3 Preview 8.5 6.8 83.3% 1 34.02s 13,331 0
Grok 4.20 Beta 4.8 10.0 0.0% 0 687ms 60 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
HY3 Preview 9.0 7.9 88.9% 1 28.07s 21,811 0
Grok 4.20 Beta 5.9 7.2 55.6% 1 541ms 291 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
HY3 Preview 10.0 10.0 100.0% 0 78.83s 10,370 0
Grok 4.20 Beta 10.0 10.0 100.0% 0 4.79s 189 0

त्वरित तुलना

तुलना जोड़ी बदलें