नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

OpenAI: GPT-5 Mini vs xAI: Grok 4.20

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-02

मेट्रिक GPT-5 Mini GPT-5 Mini medium रिलीज़: 2025-08-07 Grok 4.20 Grok 4.20 none रिलीज़: 2026-03-31
स्कोर 6.8 5.4
रैंक #45 #69
संगति 8.5 9.5
सही परीक्षण
प्रति प्रयास पास दर 58.8% 31.4%
अस्थिर टेस्ट 3 1
कुल रन 51 51
प्रति परिणाम लागत 1.473 1.809
कुल लागत $0.118 $0.091
???? ??? $0.250 / 1M $2.000 / 1M
????? ??? $2.000 / 1M $6.000 / 1M
आउटपुट टोकन 5,896 1,655
रीजनिंग टोकन 49,322 0
प्रतिक्रिया समय (औसत) 24.02s 1.11s
प्रतिक्रिया समय (अधिकतम) 88.15s 6.04s
प्रतिक्रिया समय (कुल) 408.39s 18.80s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5 Mini 7.1 7.6 66.7% 1 13.86s 1,715 6,378
Grok 4.20 4.8 10.0 25.0% 0 501ms 267 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5 Mini 10.0 10.0 100.0% 0 88.15s 754 11,520
Grok 4.20 3.0 10.0 0.0% 0 6.04s 282 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5 Mini 10.0 10.0 100.0% 0 12.58s 453 3,200
Grok 4.20 10.0 10.0 100.0% 0 522ms 207 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5 Mini 3.6 7.2 22.2% 1 44.63s 293 14,016
Grok 4.20 3.0 10.0 0.0% 0 687ms 325 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5 Mini 4.5 10.0 0.0% 0 13.50s 349 1,856
Grok 4.20 4.8 10.0 0.0% 0 659ms 83 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5 Mini 8.0 6.6 83.3% 1 15.66s 318 4,992
Grok 4.20 4.8 10.0 0.0% 0 455ms 60 0
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5 Mini 5.6 9.8 33.3% 0 14.09s 1,527 5,760
Grok 4.20 5.3 7.4 44.4% 1 487ms 242 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5 Mini 10.0 10.0 100.0% 0 18.64s 487 1,600
Grok 4.20 10.0 10.0 100.0% 0 4.63s 189 0

त्वरित तुलना

तुलना जोड़ी बदलें