नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Hunter Alpha vs xAI: Grok 4.20 Beta

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-12

मेट्रिक Hunter Alpha Hunter Alpha medium रिलीज़: रिलीज़ तिथि अज्ञात Grok 4.20 Beta Grok 4.20 Beta none रिलीज़: 2026-03-12
रैंक #35 #52
औसत स्कोर 5.9 4.4
संगति 7.6 9.1
प्रति परिणाम लागत 0.000 2.214
कुल लागत $0.000 $0.089
सही परीक्षण
प्रति प्रयास पास दर 68.8% 33.3%
अस्थिर टेस्ट 5 2
कुल रन 48 48
आउटपुट टोकन 4,686 1,511
रीजनिंग टोकन 17,821 0
प्रतिक्रिया समय (औसत) 10.71s 1.22s
प्रतिक्रिया समय (अधिकतम) 30.53s 6.48s
प्रतिक्रिया समय (कुल) 171.41s 19.53s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

औसत स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

औसत स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Hunter Alpha 7.0 7.2 88.9% 1 4.93s 441 1,003
Grok 4.20 Beta 3.3 7.9 22.2% 1 562ms 245 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Hunter Alpha 10.0 1.6 66.7% 1 30.53s 792 3,456
Grok 4.20 Beta 10.0 10.0 0.0% 0 6.48s 282 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Hunter Alpha 9.9 10.0 100.0% 0 23.16s 1,488 8,017
Grok 4.20 Beta 9.9 10.0 100.0% 0 601ms 197 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Hunter Alpha 10.0 10.0 0.0% 0 10.52s 892 2,406
Grok 4.20 Beta 10.0 10.0 0.0% 0 611ms 160 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Hunter Alpha 8.0 3.7 66.7% 1 6.44s 116 260
Grok 4.20 Beta 5.0 10.0 0.0% 0 541ms 87 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Hunter Alpha 9.5 10.0 100.0% 0 4.18s 208 465
Grok 4.20 Beta 4.5 10.0 0.0% 0 687ms 60 0
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Hunter Alpha 4.3 4.7 66.7% 2 5.36s 441 1,310
Grok 4.20 Beta 4.0 7.2 55.6% 1 541ms 291 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Hunter Alpha 10.0 10.0 100.0% 0 17.33s 308 904
Grok 4.20 Beta 10.0 10.0 100.0% 0 4.79s 189 0

त्वरित तुलना

तुलना जोड़ी बदलें