नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

OpenAI: GPT-5.4 vs xAI: Grok 4.20

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-10

मेट्रिक GPT-5.4 GPT-5.4 none रिलीज़: 2026-03-05 Grok 4.20 Grok 4.20 none रिलीज़: 2026-03-31
स्कोर 5.7 5.4
रैंक #100 #115
विश्वसनीयता 10.0 लागू नहीं
संगति 9.1 9.5
सही परीक्षण
प्रति प्रयास पास दर 40.4% 35.2%
अस्थिर टेस्ट 2 1
कुल रन 57 54
प्रति परिणाम लागत 1.493 1.574
कुल लागत $0.105 $0.095
???? ??? $2.500 / 1M $1.250 / 1M
????? ??? $15.000 / 1M $2.500 / 1M
आउटपुट टोकन 2,357 1,967
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.48s 1.11s
प्रतिक्रिया समय (अधिकतम) 2.95s 6.04s
प्रतिक्रिया समय (कुल) 28.20s 20.02s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 3.2 8.0 8.3% 1 1.21s 406 0
Grok 4.20 4.8 10.0 25.0% 0 501ms 267 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 2.95s 480 0
Grok 4.20 3.4 9.3 0.0% 0 1.22s 312 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 3.0 10.0 0.0% 0 2.89s 291 0
Grok 4.20 3.0 10.0 0.0% 0 6.04s 282 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 1.04s 222 0
Grok 4.20 10.0 10.0 100.0% 0 522ms 207 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 5.3 7.2 44.4% 1 1.07s 50 0
Grok 4.20 3.0 10.0 0.0% 0 687ms 325 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 4.4 9.9 0.0% 0 1.78s 184 0
Grok 4.20 4.8 10.0 0.0% 0 659ms 83 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 6.5 10.0 50.0% 0 1.07s 81 0
Grok 4.20 6.3 10.0 50.0% 0 455ms 60 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 5.6 9.8 33.3% 0 1.52s 357 0
Grok 4.20 5.3 7.2 44.4% 1 487ms 242 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0
Grok 4.20 10.0 10.0 100.0% 0 4.63s 189 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 3.0 10.0 0.0% 0 990ms 40 0
Grok 4.20 - - - - - - - -

त्वरित तुलना

तुलना जोड़ी बदलें