नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.3 Chat vs xAI: Grok Build 0.1

सारांश

GPT-5.3 Chat vs Grok Build 0.1 benchmark तुलना: Grok Build 0.1 average score मध्ये पुढे आहे: 7.6 vs 7.5. GPT-5.3 Chat चा benchmark खर्च कमी आहे: $0.433 vs $0.927. GPT-5.3 Chat वेगवान आहे: 6.34s vs 49.90s, pass rates 66.7% vs 61.9%.

शिफारस केलेले मॉडेल: GPT-5.3 Chat - Its score stays close to the best score here (7.5 vs 7.6), while costing about 2.1x less than Grok Build 0.1.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-07-02

मेट्रिक GPT-5.3 Chat GPT-5.3 Chat none प्रकाशन: 2026-03-03 Grok Build 0.1 Grok Build 0.1 medium प्रकाशन: 2026-05-21
स्कोअर 7.5 7.6
क्रमांक #47 #44
विश्वसनीयता 10.0 10.0
सुसंगतता 8.1 9.9
बरोबर चाचण्या
प्रति प्रयत्न पास दर 66.7% 61.9%
अस्थिर चाचण्या 5 0
एकूण रन 63 63
प्रति निकाल खर्च 3.605 7.124
एकूण खर्च $0.433 $0.927
इनपुट किंमत $1.750 / 1M $1.000 / 1M
आउटपुट किंमत $14.000 / 1M $2.000 / 1M
एकूण इनपुट टोकन्स 34,209 44,418
आउटपुट टोकन्स 26,617 2,782
रिझनिंग टोकन्स 0 438,018
प्रतिसाद वेळ (सरासरी) 6.34s 49.90s
प्रतिसाद वेळ (कमाल) 18.33s 252.69s
प्रतिसाद वेळ (एकूण) 133.13s 1047.92s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#47 GPT-5.3 Chat

none
खर्च
$0.008
वेळ
8.1s
टोकन्स
634 tok

#44 xAI: Grok Build 0.1

medium
खर्च
$0.028
वेळ
81.3s
टोकन्स
14,009 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 606 3,167 0
Grok Build 0.1 8.3 10.0 75.0% 0 7.43s 2,010 220 12,162
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 5.6 4.7 55.6% 2 10.52s 7,302 6,632 0
Grok Build 0.1 5.7 9.7 33.3% 0 108.46s 8,304 1,138 161,452
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 11,019 2,614 0
Grok Build 0.1 10.0 10.0 100.0% 0 32.81s 12,909 231 16,917
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 7,140 942 0
Grok Build 0.1 10.0 10.0 100.0% 0 10.72s 7,761 180 8,876
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 723 8,264 0
Grok Build 0.1 5.3 10.0 33.3% 0 158.00s 1,764 492 175,294
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 477 319 0
Grok Build 0.1 4.4 9.9 0.0% 0 18.41s 825 76 6,345
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 9.8 10.0 100.0% 0 3.51s 660 1,491 0
Grok Build 0.1 9.8 10.0 100.0% 0 12.36s 1,362 57 9,599
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.99s 642 1,758 0
Grok Build 0.1 7.7 10.0 66.7% 0 18.26s 1,689 195 20,841
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 5,445 861 0
Grok Build 0.1 10.0 10.0 100.0% 0 13.12s 7,263 180 4,969
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-5.3 Chat 3.0 10.0 0.0% 0 4.38s 195 569 0
Grok Build 0.1 3.0 10.0 0.0% 0 53.51s 531 13 21,563

झटपट तुलना

तुलना जोडी बदला