नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

OpenAI: GPT-5.3 Chat vs xAI: Grok 4.20

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-02

मेट्रिक GPT-5.3 Chat GPT-5.3 Chat none रिलीज़: 2026-03-03 Grok 4.20 Grok 4.20 medium रिलीज़: 2026-03-31
स्कोर 7.6 7.1
रैंक #32 #40
संगति 8.6 8.2
सही परीक्षण
प्रति प्रयास पास दर 66.7% 66.7%
अस्थिर टेस्ट 3 4
कुल रन 51 51
प्रति परिणाम लागत 3.177 7.358
कुल लागत $0.318 $0.663
???? ??? $1.750 / 1M $2.000 / 1M
????? ??? $14.000 / 1M $6.000 / 1M
आउटपुट टोकन 19,348 1,494
रीजनिंग टोकन 0 97,078
प्रतिक्रिया समय (औसत) 5.68s 9.50s
प्रतिक्रिया समय (अधिकतम) 18.33s 29.87s
प्रतिक्रिया समय (कुल) 96.58s 161.54s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 3,167 0
Grok 4.20 8.2 7.9 83.3% 1 3.36s 280 8,476
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 2,614 0
Grok 4.20 10.0 10.0 100.0% 0 17.40s 232 9,556
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 942 0
Grok 4.20 10.0 10.0 100.0% 0 4.17s 180 5,333
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 8,264 0
Grok 4.20 5.3 10.0 33.3% 0 27.03s 375 49,339
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 319 0
Grok 4.20 5.8 2.8 66.7% 1 7.09s 47 4,252
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 8.3 10.0 50.0% 0 3.29s 1,455 0
Grok 4.20 7.3 5.9 83.3% 1 4.42s 40 5,474
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.93s 1,726 0
Grok 4.20 6.4 7.7 55.6% 1 3.89s 143 8,028
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 861 0
Grok 4.20 3.0 10.0 0.0% 0 13.68s 197 6,620

त्वरित तुलना

तुलना जोड़ी बदलें