नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 Mini vs xAI: Grok 4.20

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-02

मेट्रिक GPT-5.4 Mini GPT-5.4 Mini medium प्रकाशन: 2026-03-17 Grok 4.20 Grok 4.20 medium प्रकाशन: 2026-03-31
स्कोअर 7.1 7.1
क्रमांक #41 #40
सुसंगतता 7.2 8.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 68.6% 66.7%
अस्थिर चाचण्या 6 4
एकूण रन 51 51
प्रति निकाल खर्च 3.610 7.358
एकूण खर्च $0.289 $0.663
???? ??? $0.750 / 1M $2.000 / 1M
????? ??? $4.500 / 1M $6.000 / 1M
आउटपुट टोकन्स 1,708 1,494
रिझनिंग टोकन्स 58,019 97,078
प्रतिसाद वेळ (सरासरी) 15.66s 9.50s
प्रतिसाद वेळ (कमाल) 102.91s 29.87s
प्रतिसाद वेळ (एकूण) 266.14s 161.54s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 8.6 7.9 91.7% 1 4.05s 296 2,876
Grok 4.20 8.2 7.9 83.3% 1 3.36s 280 8,476
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 10.0 10.0 100.0% 0 17.81s 317 4,317
Grok 4.20 10.0 10.0 100.0% 0 17.40s 232 9,556
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 10.0 10.0 100.0% 0 2.43s 234 650
Grok 4.20 10.0 10.0 100.0% 0 4.17s 180 5,333
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 4.1 4.4 44.5% 2 65.31s 60 43,286
Grok 4.20 5.3 10.0 33.3% 0 27.03s 375 49,339
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 4.5 10.0 0.0% 0 3.72s 150 510
Grok 4.20 5.8 2.8 66.7% 1 7.09s 47 4,252
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 7.4 6.5 66.7% 1 2.50s 129 1,337
Grok 4.20 7.3 5.9 83.3% 1 4.42s 40 5,474
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 6.8 7.9 55.6% 1 4.33s 271 2,449
Grok 4.20 6.4 7.7 55.6% 1 3.89s 143 8,028
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 4.7 1.6 66.7% 1 9.62s 251 2,594
Grok 4.20 3.0 10.0 0.0% 0 13.68s 197 6,620

झटपट तुलना

तुलना जोडी बदला