नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 Mini vs xAI: Grok Build 0.1

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-22

मेट्रिक GPT-5.4 Mini GPT-5.4 Mini medium प्रकाशन: 2026-03-17 Grok Build 0.1 Grok Build 0.1 none प्रकाशन: 2026-05-21
स्कोअर 7.1 6.6
क्रमांक #65 #82
विश्वसनीयता 10.0 10.0
सुसंगतता 7.6 8.0
बरोबर चाचण्या
प्रति प्रयत्न पास दर 68.3% 60.4%
अस्थिर चाचण्या 6 4
एकूण रन 60 57
प्रति निकाल खर्च 4.867 7.805
एकूण खर्च $0.487 $0.547
???? ??? $0.750 / 1M $1.000 / 1M
????? ??? $4.500 / 1M $2.000 / 1M
आउटपुट टोकन्स 2,186 267,275
रिझनिंग टोकन्स 100,706 0
प्रतिसाद वेळ (सरासरी) 22.14s 28.69s
प्रतिसाद वेळ (कमाल) 138.75s 138.35s
प्रतिसाद वेळ (एकूण) 442.74s 459.00s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 8.6 7.9 91.7% 1 4.05s 296 2,876
Grok Build 0.1 8.7 7.9 91.7% 1 6.30s 11,162 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 7.5 6.0 83.3% 1 73.25s 446 32,513
Grok Build 0.1 10.0 10.0 100.0% 0 21.41s 16,568 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 10.0 10.0 100.0% 0 17.81s 317 4,317
Grok Build 0.1 0.0 0.0 0.0% 0 0ms 0 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 10.0 10.0 100.0% 0 2.43s 234 650
Grok Build 0.1 4.7 1.6 66.7% 1 9.33s 6,359 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 4.1 4.4 44.5% 2 65.31s 60 43,286
Grok Build 0.1 3.6 7.2 22.2% 1 103.71s 179,469 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 4.5 10.0 0.0% 0 3.72s 150 510
Grok Build 0.1 4.3 10.0 0.0% 0 12.47s 6,647 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 7.4 6.7 66.7% 1 2.50s 129 1,337
Grok Build 0.1 9.8 10.0 100.0% 0 7.36s 8,970 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 7.8 10.0 66.7% 0 4.33s 271 2,449
Grok Build 0.1 6.4 7.7 55.6% 1 9.55s 14,982 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 4.7 1.6 66.7% 1 9.62s 251 2,594
Grok Build 0.1 0.0 0.0 0.0% 0 0ms 0 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.4 Mini 3.0 10.0 0.0% 0 30.10s 32 10,174
Grok Build 0.1 3.0 10.0 0.0% 0 36.09s 23,118 0

झटपट तुलना

तुलना जोडी बदला