नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

OpenAI: GPT-5.4 Mini vs xAI: Grok 4.20

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-29

मेट्रिक GPT-5.4 Mini GPT-5.4 Mini none रिलीज़: 2026-03-17 Grok 4.20 Grok 4.20 none रिलीज़: 2026-03-31
स्कोर 5.1 5.2
रैंक #112 #108
विश्वसनीयता लागू नहीं लागू नहीं
संगति 8.6 9.5
सही परीक्षण
प्रति प्रयास पास दर 35.2% 29.6%
अस्थिर टेस्ट 3 1
कुल रन 54 54
प्रति परिणाम लागत 0.630 1.889
कुल लागत $0.032 $0.095
???? ??? $0.750 / 1M $2.000 / 1M
????? ??? $4.500 / 1M $6.000 / 1M
आउटपुट टोकन 2,418 1,967
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.17s 1.11s
प्रतिक्रिया समय (अधिकतम) 2.52s 6.04s
प्रतिक्रिया समय (कुल) 21.01s 20.02s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 654 0
Grok 4.20 4.8 10.0 25.0% 0 501ms 267 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.19s 333 0
Grok 4.20 3.4 9.3 0.0% 0 1.22s 312 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 298 0
Grok 4.20 3.0 10.0 0.0% 0 6.04s 282 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 222 0
Grok 4.20 10.0 10.0 100.0% 0 522ms 207 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 88 0
Grok 4.20 3.0 10.0 0.0% 0 687ms 325 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 174 0
Grok 4.20 4.8 10.0 0.0% 0 659ms 83 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 101 0
Grok 4.20 4.8 10.0 0.0% 0 455ms 60 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 5.4 10.0 33.3% 0 860ms 293 0
Grok 4.20 5.3 7.4 44.4% 1 487ms 242 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 255 0
Grok 4.20 10.0 10.0 100.0% 0 4.63s 189 0

त्वरित तुलना

तुलना जोड़ी बदलें