नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-5.2 vs xAI: Grok 4.20

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-10

मेट्रिक GPT-5.2 GPT-5.2 medium रिलीज़: 2025-12-11 Grok 4.20 Grok 4.20 medium रिलीज़: 2026-03-31
स्कोर 7.2 6.9
रैंक #60 #68
विश्वसनीयता 10.0 10.0
संगति 8.2 8.3
सही परीक्षण
प्रति प्रयास पास दर 68.4% 63.2%
अस्थिर टेस्ट 4 4
कुल रन 57 57
प्रति परिणाम लागत 3.609 7.559
कुल लागत $0.397 $0.756
???? ??? $1.750 / 1M $1.250 / 1M
????? ??? $14.000 / 1M $2.500 / 1M
आउटपुट टोकन 2,731 1,784
रीजनिंग टोकन 22,200 128,233
प्रतिक्रिया समय (औसत) 15.22s 14.53s
प्रतिक्रिया समय (अधिकतम) 77.80s 63.48s
प्रतिक्रिया समय (कुल) 182.59s 276.06s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 6.5 8.0 58.3% 1 7.81s 567 2,002
Grok 4.20 8.2 7.9 83.3% 1 3.95s 287 8,312
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 10.0 10.0 100.0% 0 15.12s 467 2,166
Grok 4.20 4.3 1.1 66.7% 1 24.33s 250 12,804
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 10.0 10.0 100.0% 0 14.06s 291 1,757
Grok 4.20 10.0 10.0 100.0% 0 17.40s 232 9,556
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 10.0 10.0 100.0% 0 3.15s 234 420
Grok 4.20 10.0 10.0 100.0% 0 4.17s 180 5,333
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 5.9 7.2 55.6% 1 77.80s 42 10,342
Grok 4.20 5.3 10.0 33.3% 0 27.03s 375 49,339
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 3.7 9.7 0.0% 0 4.32s 162 269
Grok 4.20 3.9 2.6 33.3% 1 24.48s 65 6,440
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 9.9 10.0 100.0% 0 3.12s 94 614
Grok 4.20 7.3 6.0 83.3% 1 4.42s 40 5,474
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 7.6 7.3 77.8% 1 5.47s 609 938
Grok 4.20 7.7 10.0 66.7% 0 6.20s 149 7,913
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 4.7 1.6 66.7% 1 10.30s 239 469
Grok 4.20 3.0 10.0 0.0% 0 13.68s 197 6,620
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 3.0 10.0 0.0% 0 28.18s 26 3,223
Grok 4.20 3.0 10.0 0.0% 0 63.48s 9 16,442

त्वरित तुलना

तुलना जोड़ी बदलें