नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

Owl Alpha vs xAI: Grok 4.20

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-10

मेट्रिक Owl Alpha Owl Alpha none प्रकाशन: 2026-04-30 Grok 4.20 Grok 4.20 none प्रकाशन: 2026-03-31
स्कोअर 5.8 5.4
क्रमांक #98 #115
विश्वसनीयता 10.0 लागू नाही
सुसंगतता 9.1 9.5
बरोबर चाचण्या
प्रति प्रयत्न पास दर 43.9% 35.2%
अस्थिर चाचण्या 2 1
एकूण रन 57 54
प्रति निकाल खर्च 0.000 1.574
एकूण खर्च $0.000 $0.095
???? ??? $0.000 / 1M $1.250 / 1M
????? ??? $0.000 / 1M $2.500 / 1M
आउटपुट टोकन्स 1,685 1,967
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 6.83s 1.11s
प्रतिसाद वेळ (कमाल) 32.27s 6.04s
प्रतिसाद वेळ (एकूण) 129.73s 20.02s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Owl Alpha 3.4 7.9 16.7% 1 2.78s 57 0
Grok 4.20 4.8 10.0 25.0% 0 501ms 267 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Owl Alpha 10.0 10.0 100.0% 0 32.27s 450 0
Grok 4.20 3.4 9.3 0.0% 0 1.22s 312 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Owl Alpha 3.0 10.0 0.0% 0 21.74s 315 0
Grok 4.20 3.0 10.0 0.0% 0 6.04s 282 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Owl Alpha 10.0 10.0 100.0% 0 3.60s 246 0
Grok 4.20 10.0 10.0 100.0% 0 522ms 207 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Owl Alpha 5.3 10.0 33.3% 0 3.00s 27 0
Grok 4.20 3.0 10.0 0.0% 0 687ms 325 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Owl Alpha 4.3 10.0 0.0% 0 4.61s 80 0
Grok 4.20 4.8 10.0 0.0% 0 659ms 83 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Owl Alpha 6.4 10.0 50.0% 0 2.63s 63 0
Grok 4.20 6.3 10.0 50.0% 0 455ms 60 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Owl Alpha 5.9 7.2 55.6% 1 4.43s 202 0
Grok 4.20 5.3 7.2 44.4% 1 487ms 242 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Owl Alpha 10.0 10.0 100.0% 0 22.78s 231 0
Grok 4.20 10.0 10.0 100.0% 0 4.63s 189 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Owl Alpha 3.0 10.0 0.0% 0 2.50s 14 0
Grok 4.20 - - - - - - - -

झटपट तुलना

तुलना जोडी बदला