नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Elephant vs xAI: Grok 4.20

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-14

मेट्रिक Elephant Elephant none प्रकाशन: 2026-04-14 Grok 4.20 Grok 4.20 none प्रकाशन: 2026-03-31
स्कोअर 5.2 5.2
क्रमांक #81 #78
सुसंगतता 9.6 9.5
बरोबर चाचण्या
प्रति प्रयत्न पास दर 31.5% 29.6%
अस्थिर चाचण्या 1 1
एकूण रन 54 54
प्रति निकाल खर्च 0.000 1.889
एकूण खर्च $0.000 $0.095
???? ??? $0.000 / 1M $2.000 / 1M
????? ??? $0.000 / 1M $6.000 / 1M
आउटपुट टोकन्स 2,573 1,967
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 1.23s 1.11s
प्रतिसाद वेळ (कमाल) 3.81s 6.04s
प्रतिसाद वेळ (एकूण) 22.16s 20.02s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Elephant 6.6 10.0 50.0% 0 963ms 610 0
Grok 4.20 4.8 10.0 25.0% 0 501ms 267 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Elephant 6.4 3.3 66.7% 1 1.39s 375 0
Grok 4.20 3.4 9.3 0.0% 0 1.22s 312 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Elephant 3.0 10.0 0.0% 0 3.81s 731 0
Grok 4.20 3.0 10.0 0.0% 0 6.04s 282 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Elephant 6.5 10.0 50.0% 0 1.04s 246 0
Grok 4.20 10.0 10.0 100.0% 0 522ms 207 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Elephant 3.0 10.0 0.0% 0 927ms 24 0
Grok 4.20 3.0 10.0 0.0% 0 687ms 325 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Elephant 4.0 10.0 0.0% 0 854ms 106 0
Grok 4.20 4.8 10.0 0.0% 0 659ms 83 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Elephant 9.8 10.0 100.0% 0 1.03s 81 0
Grok 4.20 4.8 10.0 0.0% 0 455ms 60 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Elephant 3.3 10.0 0.0% 0 849ms 170 0
Grok 4.20 5.3 7.4 44.4% 1 487ms 242 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Elephant 3.0 10.0 0.0% 0 2.79s 230 0
Grok 4.20 10.0 10.0 100.0% 0 4.63s 189 0

झटपट तुलना

तुलना जोडी बदला