नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

तुलना केलेली मॉडेल्स

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-26

मेट्रिक Grok 4.20 Beta Grok 4.20 Beta medium प्रकाशन: 2026-03-12 Grok 4.1 Fast Grok 4.1 Fast medium प्रकाशन: 2025-11-19 Hunter Alpha Hunter Alpha medium प्रकाशन: 2026-03-11
स्कोअर 8.5 6.5 6.7
क्रमांक #14 #88 #76
विश्वसनीयता लागू नाही 10.0 लागू नाही
सुसंगतता 9.5 7.3 7.4
बरोबर चाचण्या
प्रति प्रयत्न पास दर 81.5% 61.4% 64.8%
अस्थिर चाचण्या 1 6 6
एकूण रन 52 57 52
प्रति निकाल खर्च 4.505 0.642 0.000
एकूण खर्च $0.631 $0.058 $0.000
???? ??? $0.000 / 1M $0.000 / 1M $0.000 / 1M
????? ??? $0.000 / 1M $0.000 / 1M $0.000 / 1M
आउटपुट टोकन्स 1,647 2,006 4,682
रिझनिंग टोकन्स 91,565 96,334 17,969
प्रतिसाद वेळ (सरासरी) 9.75s 23.85s 10.33s
प्रतिसाद वेळ (कमाल) 31.36s 121.79s 30.53s
प्रतिसाद वेळ (एकूण) 175.48s 286.16s 175.58s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 8.7 7.9 91.7% 1 3.16s 268 7,583
Grok 4.1 Fast 8.7 7.9 91.7% 1 3.81s 108 4,741
Hunter Alpha 7.3 5.8 83.3% 2 4.75s 479 1,103
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 10.0 10.0 100.0% 0 31.36s 81 3,987
Grok 4.1 Fast 2.3 1.1 33.3% 1 23.58s 821 6,703
Hunter Alpha 3.0 10.0 0.0% 0 0ms 0 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 10.0 10.0 100.0% 0 20.93s 227 12,212
Grok 4.1 Fast 10.0 10.0 100.0% 0 37.64s 261 12,272
Hunter Alpha 4.7 1.6 66.7% 1 30.53s 792 3,456
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 10.0 10.0 100.0% 0 4.01s 180 5,281
Grok 4.1 Fast 10.0 10.0 100.0% 0 6.63s 180 5,409
Hunter Alpha 10.0 10.0 100.0% 0 23.16s 1,488 8,017
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 5.3 10.0 33.3% 0 21.33s 251 40,255
Grok 4.1 Fast 5.8 4.4 66.7% 2 121.79s 11 37,657
Hunter Alpha 3.0 10.0 0.0% 0 10.52s 892 2,406
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 10.0 10.0 100.0% 0 5.78s 72 3,440
Grok 4.1 Fast 4.2 9.9 0.0% 0 16.25s 127 3,456
Hunter Alpha 7.0 3.7 66.7% 1 6.44s 116 260
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 9.8 10.0 100.0% 0 4.89s 57 7,123
Grok 4.1 Fast 6.5 10.0 50.0% 0 4.63s 54 3,326
Hunter Alpha 9.9 10.0 100.0% 0 4.18s 208 465
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 10.0 10.0 100.0% 0 3.52s 328 6,300
Grok 4.1 Fast 5.3 7.2 44.4% 1 7.40s 169 5,904
Hunter Alpha 6.1 4.7 66.7% 2 5.35s 399 1,358
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta 3.0 10.0 0.0% 0 12.39s 183 5,384
Grok 4.1 Fast 2.8 1.6 33.3% 1 27.71s 260 11,485
Hunter Alpha 10.0 10.0 100.0% 0 17.33s 308 904
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Grok 4.20 Beta - - - - - - - -
Grok 4.1 Fast 3.0 10.0 0.0% 0 25.52s 15 5,381
Hunter Alpha - - - - - - - -

झटपट तुलना

तुलना जोडी बदला