नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Elephant Alpha vs xAI: Grok 4.20

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-29

मेट्रिक Elephant Alpha Elephant Alpha medium रिलीज़: 2026-04-14 Grok 4.20 Grok 4.20 none रिलीज़: 2026-03-31
स्कोर 5.4 5.4
रैंक #127 #125
विश्वसनीयता लागू नहीं लागू नहीं
संगति 9.6 10.0
सही परीक्षण
प्रति प्रयास पास दर 33.3% 33.3%
अस्थिर टेस्ट 1 0
कुल रन 60 54
प्रति परिणाम लागत 0.000 1.570
कुल लागत $0.000 $0.095
इनपुट कीमत $0.000 / 1M $1.250 / 1M
आउटपुट कीमत $0.000 / 1M $2.500 / 1M
आउटपुट टोकन 2,596 1,923
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.27s 1.11s
प्रतिक्रिया समय (अधिकतम) 3.70s 6.04s
प्रतिक्रिया समय (कुल) 22.82s 19.96s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 6.6 10.0 50.0% 0 1.19s 815 0
Grok 4.20 4.8 10.0 25.0% 0 501ms 267 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 4.0 6.7 16.7% 1 1.30s 365 0
Grok 4.20 3.4 9.3 0.0% 0 1.22s 312 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 3.0 10.0 0.0% 0 3.70s 562 0
Grok 4.20 3.0 10.0 0.0% 0 6.04s 282 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 6.5 10.0 50.0% 0 979ms 246 0
Grok 4.20 10.0 10.0 100.0% 0 522ms 207 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 3.0 10.0 0.0% 0 925ms 24 0
Grok 4.20 3.0 10.0 0.0% 0 687ms 325 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 4.3 10.0 0.0% 0 920ms 105 0
Grok 4.20 4.8 10.0 0.0% 0 659ms 83 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 9.8 10.0 100.0% 0 987ms 82 0
Grok 4.20 6.3 10.0 50.0% 0 445ms 60 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 5.3 10.0 33.3% 0 868ms 166 0
Grok 4.20 5.3 10.0 33.3% 0 473ms 198 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 3.0 10.0 0.0% 0 2.83s 231 0
Grok 4.20 10.0 10.0 100.0% 0 4.63s 189 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 0.0 0.0 0.0% 0 0ms 0 0
Grok 4.20 - - - - - - - -

त्वरित तुलना

तुलना जोड़ी बदलें