नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.5 vs Grok 4.20 Beta

सारांश

GPT-5.5 vs Grok 4.20 Beta benchmark तुलना: GPT-5.5 average score मध्ये पुढे आहे: 9.3 vs 6.8. Grok 4.20 Beta चा benchmark खर्च कमी आहे: $0.750 vs $0.907. Grok 4.20 Beta वेगवान आहे: 9.75s vs 9.76s, pass rates 85.7% vs 69.8%.

शिफारस केलेले मॉडेल: GPT-5.5 - It has the strongest score in this comparison (9.3) and the best overall balance of cost and response time across all 2 models.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-18

मेट्रिक GPT-5.5 GPT-5.5 low प्रकाशन: 2026-04-24 Grok 4.20 Beta Grok 4.20 Beta medium प्रकाशन: 2026-03-12
स्कोअर 9.3 6.8
क्रमांक #4 #69
विश्वसनीयता 10.0 लागू नाही
सुसंगतता 10.0 8.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 85.7% 69.8%
अस्थिर चाचण्या 0 1
एकूण रन 63 52
प्रति निकाल खर्च 5.035 4.505
एकूण खर्च $0.907 $0.750
इनपुट किंमत $5.000 / 1M $5.805 / 1M
आउटपुट किंमत $30.000 / 1M $5.805 / 1M
एकूण इनपुट टोकन्स 34,209 35,955
आउटपुट टोकन्स 2,046 1,647
रिझनिंग टोकन्स 22,460 91,565
प्रतिसाद वेळ (सरासरी) 9.76s 9.75s
प्रतिसाद वेळ (कमाल) 56.19s 31.36s
प्रतिसाद वेळ (एकूण) 204.92s 175.48s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#4 GPT-5.5

low
खर्च
$0.068
वेळ
37.0s
टोकन्स
2,339 tok

#69 Grok 4.20 Beta

medium
खर्च
$0.034
वेळ
91.0s
टोकन्स
13,523 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 4.41s 606 238 1,020
Grok 4.20 Beta 8.7 7.9 91.7% 1 3.16s 2,010 268 7,583
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 15.04s 7,302 423 6,402
Grok 4.20 Beta 3.3 3.3 33.3% 0 31.36s 360 81 3,987
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 9.56s 11,019 303 717
Grok 4.20 Beta 10.0 10.0 100.0% 0 20.93s 12,909 227 12,212
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 3.28s 7,140 228 157
Grok 4.20 Beta 10.0 10.0 100.0% 0 4.01s 7,761 180 5,281
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 5.3 10.0 33.3% 0 28.05s 723 69 11,609
Grok 4.20 Beta 5.3 10.0 33.3% 0 21.33s 1,764 251 40,255
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 5.17s 477 133 245
Grok 4.20 Beta 10.0 10.0 100.0% 0 5.78s 825 72 3,440
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 9.9 10.0 100.0% 0 3.74s 660 93 415
Grok 4.20 Beta 9.8 10.0 100.0% 0 4.89s 1,362 57 7,123
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 4.74s 642 279 954
Grok 4.20 Beta 10.0 10.0 100.0% 0 3.52s 1,689 328 6,300
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 4.96s 5,445 250 101
Grok 4.20 Beta 3.0 10.0 0.0% 0 12.39s 7,275 183 5,384
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 3.0 10.0 0.0% 0 10.06s 195 30 840
Grok 4.20 Beta 0.0 0.0 0.0% 0 0ms 0 0 0

झटपट तुलना

तुलना जोडी बदला