नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.5 vs xAI: Grok Build 0.1

सारांश

GPT-5.5 vs Grok Build 0.1 benchmark तुलना: GPT-5.5 average score मध्ये पुढे आहे: 9.3 vs 7.6. GPT-5.5 चा benchmark खर्च कमी आहे: $0.907 vs $0.927. GPT-5.5 वेगवान आहे: 9.76s vs 49.90s, pass rates 85.7% vs 61.9%.

शिफारस केलेले मॉडेल: GPT-5.5 - It has the best score here (9.3), while responding about 5.1x faster than Grok Build 0.1.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-07-02

मेट्रिक GPT-5.5 GPT-5.5 low प्रकाशन: 2026-04-24 Grok Build 0.1 Grok Build 0.1 medium प्रकाशन: 2026-05-21
स्कोअर 9.3 7.6
क्रमांक #4 #44
विश्वसनीयता 10.0 10.0
सुसंगतता 10.0 9.9
बरोबर चाचण्या
प्रति प्रयत्न पास दर 85.7% 61.9%
अस्थिर चाचण्या 0 0
एकूण रन 63 63
प्रति निकाल खर्च 5.035 7.124
एकूण खर्च $0.907 $0.927
इनपुट किंमत $5.000 / 1M $1.000 / 1M
आउटपुट किंमत $30.000 / 1M $2.000 / 1M
एकूण इनपुट टोकन्स 34,209 44,418
आउटपुट टोकन्स 2,046 2,782
रिझनिंग टोकन्स 22,460 438,018
प्रतिसाद वेळ (सरासरी) 9.76s 49.90s
प्रतिसाद वेळ (कमाल) 56.19s 252.69s
प्रतिसाद वेळ (एकूण) 204.92s 1047.92s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#4 GPT-5.5

low
खर्च
$0.068
वेळ
37.0s
टोकन्स
2,339 tok

#44 xAI: Grok Build 0.1

medium
खर्च
$0.028
वेळ
81.3s
टोकन्स
14,009 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 4.41s 606 238 1,020
Grok Build 0.1 8.3 10.0 75.0% 0 7.43s 2,010 220 12,162
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 15.04s 7,302 423 6,402
Grok Build 0.1 5.7 9.7 33.3% 0 108.46s 8,304 1,138 161,452
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 9.56s 11,019 303 717
Grok Build 0.1 10.0 10.0 100.0% 0 32.81s 12,909 231 16,917
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 3.28s 7,140 228 157
Grok Build 0.1 10.0 10.0 100.0% 0 10.72s 7,761 180 8,876
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 5.3 10.0 33.3% 0 28.05s 723 69 11,609
Grok Build 0.1 5.3 10.0 33.3% 0 158.00s 1,764 492 175,294
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 5.17s 477 133 245
Grok Build 0.1 4.4 9.9 0.0% 0 18.41s 825 76 6,345
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 9.9 10.0 100.0% 0 3.74s 660 93 415
Grok Build 0.1 9.8 10.0 100.0% 0 12.36s 1,362 57 9,599
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 4.74s 642 279 954
Grok Build 0.1 7.7 10.0 66.7% 0 18.26s 1,689 195 20,841
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 10.0 10.0 100.0% 0 4.96s 5,445 250 101
Grok Build 0.1 10.0 10.0 100.0% 0 13.12s 7,263 180 4,969
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.5 3.0 10.0 0.0% 0 10.06s 195 30 840
Grok Build 0.1 3.0 10.0 0.0% 0 53.51s 531 13 21,563

झटपट तुलना

तुलना जोडी बदला