नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Owl Alpha vs xAI: Grok 4.20

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-10

मेट्रिक Owl Alpha Owl Alpha medium प्रकाशन: 2026-04-30 Grok 4.20 Grok 4.20 none प्रकाशन: 2026-03-31
स्कोअर 6.0 5.4
क्रमांक #90 #115
विश्वसनीयता 10.0 लागू नाही
सुसंगतता 9.6 9.5
बरोबर चाचण्या
प्रति प्रयत्न पास दर 43.9% 35.2%
अस्थिर चाचण्या 1 1
एकूण रन 57 54
प्रति निकाल खर्च 0.000 1.574
एकूण खर्च $0.000 $0.095
???? ??? $0.000 / 1M $1.250 / 1M
????? ??? $0.000 / 1M $2.500 / 1M
आउटपुट टोकन्स 1,613 1,967
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 10.58s 1.11s
प्रतिसाद वेळ (कमाल) 58.63s 6.04s
प्रतिसाद वेळ (एकूण) 201.03s 20.02s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Owl Alpha 4.8 10.0 25.0% 0 3.97s 87 0
Grok 4.20 4.8 10.0 25.0% 0 501ms 267 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Owl Alpha 10.0 10.0 100.0% 0 7.35s 402 0
Grok 4.20 3.4 9.3 0.0% 0 1.22s 312 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Owl Alpha 3.0 10.0 0.0% 0 10.01s 315 0
Grok 4.20 3.0 10.0 0.0% 0 6.04s 282 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Owl Alpha 10.0 10.0 100.0% 0 21.64s 246 0
Grok 4.20 10.0 10.0 100.0% 0 522ms 207 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Owl Alpha 5.3 10.0 33.3% 0 8.58s 28 0
Grok 4.20 3.0 10.0 0.0% 0 687ms 325 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Owl Alpha 4.3 10.0 0.0% 0 58.63s 98 0
Grok 4.20 4.8 10.0 0.0% 0 659ms 83 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Owl Alpha 6.3 10.0 50.0% 0 9.59s 57 0
Grok 4.20 6.3 10.0 50.0% 0 455ms 60 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Owl Alpha 5.3 7.2 44.4% 1 3.44s 135 0
Grok 4.20 5.3 7.2 44.4% 1 487ms 242 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Owl Alpha 10.0 10.0 100.0% 0 8.26s 228 0
Grok 4.20 10.0 10.0 100.0% 0 4.63s 189 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Owl Alpha 3.0 10.0 0.0% 0 2.38s 17 0
Grok 4.20 - - - - - - - -

झटपट तुलना

तुलना जोडी बदला