نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.5 Flash vs xAI: Grok 4.3

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-05-19

میٹرک Gemini 3.5 Flash Gemini 3.5 Flash minimal اجرا: 2026-05-19 Grok 4.3 Grok 4.3 medium اجرا: 2026-05-01
اسکور 8.1 8.0
درجہ #21 #29
اعتماد پذیری 10.0 10.0
تسلسل 9.6 8.7
درست ٹیسٹس
فی کوشش کامیابی کی شرح 75.4% 77.2%
غیر مستحکم ٹیسٹ 1 3
کل رنز 57 57
فی نتیجہ لاگت 0.494 4.229
کل لاگت $0.070 $0.550
?? ?? ???? $1.500 / 1M $1.250 / 1M
??? ?? ???? $9.000 / 1M $2.500 / 1M
آؤٹ پٹ ٹوکنز 2,262 1,237
ریزننگ ٹوکنز 0 200,033
ردِعمل کا وقت (اوسط) 1.37s 48.41s
ردِعمل کا وقت (زیادہ سے زیادہ) 3.56s 216.69s
ردِعمل کا وقت (کل) 26.04s 919.73s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 6.5 10.0 50.0% 0 892ms 405 0
Grok 4.3 10.0 10.0 100.0% 0 8.83s 88 8,207
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.28s 441 0
Grok 4.3 10.0 10.0 100.0% 0 45.72s 284 9,659
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 3.0 10.0 0.0% 0 3.56s 404 0
Grok 4.3 10.0 10.0 100.0% 0 63.99s 234 15,301
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.66s 279 0
Grok 4.3 10.0 10.0 100.0% 0 18.97s 180 9,546
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 10.0 10.0 100.0% 0 899ms 12 0
Grok 4.3 5.3 7.2 44.4% 1 181.74s 14 111,300
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 10.0 10.0 100.0% 0 922ms 117 0
Grok 4.3 5.4 2.5 66.7% 1 24.70s 70 5,020
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 6.4 5.8 66.7% 1 893ms 76 0
Grok 4.3 9.8 10.0 100.0% 0 18.58s 57 8,713
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.45s 282 0
Grok 4.3 5.9 7.2 55.6% 1 22.53s 128 14,686
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.79s 234 0
Grok 4.3 10.0 10.0 100.0% 0 17.66s 168 4,615
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 3.0 10.0 0.0% 0 1.76s 12 0
Grok 4.3 3.0 10.0 0.0% 0 44.47s 14 12,986

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں