नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.2 Chat vs xAI: Grok 4.20 Beta

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-12

मेट्रिक GPT-5.2 Chat GPT-5.2 Chat none प्रकाशन: 2025-12-11 Grok 4.20 Beta Grok 4.20 Beta medium प्रकाशन: 2026-03-12
क्रमांक #16 #24
सरासरी स्कोअर 7.4 7.0
सुसंगतता 9.1 9.0
प्रति निकाल खर्च 2.440 5.989
एकूण खर्च $0.269 $0.599
बरोबर चाचण्या
प्रति प्रयत्न पास दर 75.0% 70.8%
अस्थिर चाचण्या 2 2
एकूण रन 48 48
आउटपुट टोकन्स 15,845 1,481
रिझनिंग टोकन्स 0 86,628
प्रतिसाद वेळ (सरासरी) 7.03s 8.89s
प्रतिसाद वेळ (कमाल) 38.52s 24.21s
प्रतिसाद वेळ (एकूण) 112.51s 142.18s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

सरासरी स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.97s 1,651 0
Grok 4.20 Beta 7.0 7.2 88.9% 1 3.19s 262 6,289
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 1,243 0
Grok 4.20 Beta 10.0 10.0 100.0% 0 20.93s 227 12,212
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 Chat 9.9 10.0 100.0% 0 3.05s 980 0
Grok 4.20 Beta 9.9 10.0 100.0% 0 4.01s 180 5,281
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 Chat 4.0 10.0 33.3% 0 17.78s 7,810 0
Grok 4.20 Beta 4.0 10.0 33.3% 0 21.33s 251 40,255
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 Chat 4.0 3.0 33.3% 1 3.20s 335 0
Grok 4.20 Beta 10.0 10.0 100.0% 0 5.78s 72 3,440
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 Chat 6.0 6.1 83.3% 1 5.46s 1,528 0
Grok 4.20 Beta 9.0 10.0 50.0% 0 4.97s 57 7,107
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 Chat 7.0 10.0 66.7% 0 4.42s 1,743 0
Grok 4.20 Beta 7.0 7.2 88.9% 1 3.85s 249 6,660
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 555 0
Grok 4.20 Beta 10.0 10.0 0.0% 0 12.39s 183 5,384

झटपट तुलना

तुलना जोडी बदला