नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.2 vs xAI: Grok 4.20

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-02

मेट्रिक GPT-5.2 GPT-5.2 medium प्रकाशन: 2025-12-11 Grok 4.20 Grok 4.20 medium प्रकाशन: 2026-03-31
स्कोअर 7.3 7.1
क्रमांक #36 #40
सुसंगतता 8.0 8.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 70.6% 66.7%
अस्थिर चाचण्या 4 4
एकूण रन 51 51
प्रति निकाल खर्च 3.131 7.358
एकूण खर्च $0.314 $0.663
???? ??? $1.750 / 1M $2.000 / 1M
????? ??? $14.000 / 1M $6.000 / 1M
आउटपुट टोकन्स 2,238 1,494
रिझनिंग टोकन्स 16,811 97,078
प्रतिसाद वेळ (सरासरी) 13.93s 9.50s
प्रतिसाद वेळ (कमाल) 77.80s 29.87s
प्रतिसाद वेळ (एकूण) 139.29s 161.54s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 6.5 8.0 58.3% 1 7.81s 567 2,002
Grok 4.20 8.2 7.9 83.3% 1 3.36s 280 8,476
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 10.0 10.0 100.0% 0 14.06s 291 1,757
Grok 4.20 10.0 10.0 100.0% 0 17.40s 232 9,556
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 10.0 10.0 100.0% 0 3.15s 234 420
Grok 4.20 10.0 10.0 100.0% 0 4.17s 180 5,333
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 5.9 7.2 55.6% 1 77.80s 42 10,342
Grok 4.20 5.3 10.0 33.3% 0 27.03s 375 49,339
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 3.7 9.7 0.0% 0 4.32s 162 269
Grok 4.20 5.8 2.8 66.7% 1 7.09s 47 4,252
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 9.9 10.0 100.0% 0 3.12s 94 614
Grok 4.20 7.3 5.9 83.3% 1 4.42s 40 5,474
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 7.7 7.3 77.8% 1 5.47s 609 938
Grok 4.20 6.4 7.7 55.6% 1 3.89s 143 8,028
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 4.7 1.6 66.7% 1 10.30s 239 469
Grok 4.20 3.0 10.0 0.0% 0 13.68s 197 6,620

झटपट तुलना

तुलना जोडी बदला