نیویگیشن
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.3 Chat vs xAI: Grok Build 0.1

خلاصہ

GPT-5.3 Chat vs Grok Build 0.1 benchmark موازنہ: Grok Build 0.1 average score میں آگے ہے: 7.6 vs 7.5. GPT-5.3 Chat کی benchmark لاگت کم ہے: $0.433 vs $0.927. GPT-5.3 Chat تیز ہے: 6.34s vs 49.90s، pass rates 66.7% vs 61.9%.

تجویز کردہ ماڈل: GPT-5.3 Chat - Its score stays close to the best score here (7.5 vs 7.6), while costing about 2.1x less than Grok Build 0.1.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-07-02

میٹرک GPT-5.3 Chat GPT-5.3 Chat none اجرا: 2026-03-03 Grok Build 0.1 Grok Build 0.1 medium اجرا: 2026-05-21
اسکور 7.5 7.6
درجہ #47 #44
اعتماد پذیری 10.0 10.0
تسلسل 8.1 9.9
درست ٹیسٹس
فی کوشش کامیابی کی شرح 66.7% 61.9%
غیر مستحکم ٹیسٹ 5 0
کل رنز 63 63
فی نتیجہ لاگت 3.605 7.124
کل لاگت $0.433 $0.927
ان پٹ قیمت $1.750 / 1M $1.000 / 1M
آؤٹ پٹ قیمت $14.000 / 1M $2.000 / 1M
کل ان پٹ ٹوکنز 34,209 44,418
آؤٹ پٹ ٹوکنز 26,617 2,782
ریزننگ ٹوکنز 0 438,018
ردِعمل کا وقت (اوسط) 6.34s 49.90s
ردِعمل کا وقت (زیادہ سے زیادہ) 18.33s 252.69s
ردِعمل کا وقت (کل) 133.13s 1047.92s

جنریشن شوکیس

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#47 GPT-5.3 Chat

none
لاگت
$0.008
وقت
8.1s
ٹوکنز
634 tok

#44 xAI: Grok Build 0.1

medium
لاگت
$0.028
وقت
81.3s
ٹوکنز
14,009 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 606 3,167 0
Grok Build 0.1 8.3 10.0 75.0% 0 7.43s 2,010 220 12,162
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3 Chat 5.6 4.7 55.6% 2 10.52s 7,302 6,632 0
Grok Build 0.1 5.7 9.7 33.3% 0 108.46s 8,304 1,138 161,452
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 11,019 2,614 0
Grok Build 0.1 10.0 10.0 100.0% 0 32.81s 12,909 231 16,917
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 7,140 942 0
Grok Build 0.1 10.0 10.0 100.0% 0 10.72s 7,761 180 8,876
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 723 8,264 0
Grok Build 0.1 5.3 10.0 33.3% 0 158.00s 1,764 492 175,294
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 477 319 0
Grok Build 0.1 4.4 9.9 0.0% 0 18.41s 825 76 6,345
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3 Chat 9.8 10.0 100.0% 0 3.51s 660 1,491 0
Grok Build 0.1 9.8 10.0 100.0% 0 12.36s 1,362 57 9,599
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.99s 642 1,758 0
Grok Build 0.1 7.7 10.0 66.7% 0 18.26s 1,689 195 20,841
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 5,445 861 0
Grok Build 0.1 10.0 10.0 100.0% 0 13.12s 7,263 180 4,969
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3 Chat 3.0 10.0 0.0% 0 4.38s 195 569 0
Grok Build 0.1 3.0 10.0 0.0% 0 53.51s 531 13 21,563

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں