नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-5.4 Mini vs xAI: Grok Build 0.1

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-22

मेट्रिक GPT-5.4 Mini GPT-5.4 Mini medium रिलीज़: 2026-03-17 Grok Build 0.1 Grok Build 0.1 none रिलीज़: 2026-05-21
स्कोर 7.1 6.6
रैंक #65 #82
विश्वसनीयता 10.0 10.0
संगति 7.6 8.0
सही परीक्षण
प्रति प्रयास पास दर 68.3% 60.4%
अस्थिर टेस्ट 6 4
कुल रन 60 57
प्रति परिणाम लागत 4.867 7.805
कुल लागत $0.487 $0.547
???? ??? $0.750 / 1M $1.000 / 1M
????? ??? $4.500 / 1M $2.000 / 1M
आउटपुट टोकन 2,186 267,275
रीजनिंग टोकन 100,706 0
प्रतिक्रिया समय (औसत) 22.14s 28.69s
प्रतिक्रिया समय (अधिकतम) 138.75s 138.35s
प्रतिक्रिया समय (कुल) 442.74s 459.00s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 8.6 7.9 91.7% 1 4.05s 296 2,876
Grok Build 0.1 8.7 7.9 91.7% 1 6.30s 11,162 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 7.5 6.0 83.3% 1 73.25s 446 32,513
Grok Build 0.1 10.0 10.0 100.0% 0 21.41s 16,568 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 10.0 10.0 100.0% 0 17.81s 317 4,317
Grok Build 0.1 0.0 0.0 0.0% 0 0ms 0 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 10.0 10.0 100.0% 0 2.43s 234 650
Grok Build 0.1 4.7 1.6 66.7% 1 9.33s 6,359 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 4.1 4.4 44.5% 2 65.31s 60 43,286
Grok Build 0.1 3.6 7.2 22.2% 1 103.71s 179,469 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 4.5 10.0 0.0% 0 3.72s 150 510
Grok Build 0.1 4.3 10.0 0.0% 0 12.47s 6,647 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 7.4 6.7 66.7% 1 2.50s 129 1,337
Grok Build 0.1 9.8 10.0 100.0% 0 7.36s 8,970 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 7.8 10.0 66.7% 0 4.33s 271 2,449
Grok Build 0.1 6.4 7.7 55.6% 1 9.55s 14,982 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 4.7 1.6 66.7% 1 9.62s 251 2,594
Grok Build 0.1 0.0 0.0 0.0% 0 0ms 0 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.0 10.0 0.0% 0 30.10s 32 10,174
Grok Build 0.1 3.0 10.0 0.0% 0 36.09s 23,118 0

त्वरित तुलना

तुलना जोड़ी बदलें