नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.2 vs xAI: Grok 4.20

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-10

मेट्रिक GPT-5.2 GPT-5.2 medium प्रकाशन: 2025-12-11 Grok 4.20 Grok 4.20 medium प्रकाशन: 2026-03-31
स्कोअर 7.2 6.9
क्रमांक #60 #68
विश्वसनीयता 10.0 10.0
सुसंगतता 8.2 8.3
बरोबर चाचण्या
प्रति प्रयत्न पास दर 68.4% 63.2%
अस्थिर चाचण्या 4 4
एकूण रन 57 57
प्रति निकाल खर्च 3.609 7.559
एकूण खर्च $0.397 $0.756
???? ??? $1.750 / 1M $1.250 / 1M
????? ??? $14.000 / 1M $2.500 / 1M
आउटपुट टोकन्स 2,731 1,784
रिझनिंग टोकन्स 22,200 128,233
प्रतिसाद वेळ (सरासरी) 15.22s 14.53s
प्रतिसाद वेळ (कमाल) 77.80s 63.48s
प्रतिसाद वेळ (एकूण) 182.59s 276.06s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 6.5 8.0 58.3% 1 7.81s 567 2,002
Grok 4.20 8.2 7.9 83.3% 1 3.95s 287 8,312
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 10.0 10.0 100.0% 0 15.12s 467 2,166
Grok 4.20 4.3 1.1 66.7% 1 24.33s 250 12,804
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 10.0 10.0 100.0% 0 14.06s 291 1,757
Grok 4.20 10.0 10.0 100.0% 0 17.40s 232 9,556
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 10.0 10.0 100.0% 0 3.15s 234 420
Grok 4.20 10.0 10.0 100.0% 0 4.17s 180 5,333
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 5.9 7.2 55.6% 1 77.80s 42 10,342
Grok 4.20 5.3 10.0 33.3% 0 27.03s 375 49,339
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 3.7 9.7 0.0% 0 4.32s 162 269
Grok 4.20 3.9 2.6 33.3% 1 24.48s 65 6,440
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 9.9 10.0 100.0% 0 3.12s 94 614
Grok 4.20 7.3 6.0 83.3% 1 4.42s 40 5,474
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 7.6 7.3 77.8% 1 5.47s 609 938
Grok 4.20 7.7 10.0 66.7% 0 6.20s 149 7,913
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 4.7 1.6 66.7% 1 10.30s 239 469
Grok 4.20 3.0 10.0 0.0% 0 13.68s 197 6,620
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.2 3.0 10.0 0.0% 0 28.18s 26 3,223
Grok 4.20 3.0 10.0 0.0% 0 63.48s 9 16,442

झटपट तुलना

तुलना जोडी बदला