نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 2.5 Flash vs xAI: Grok 4.3

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-05-01

میٹرک Gemini 2.5 Flash Gemini 2.5 Flash medium اجرا: 2025-06-17 Grok 4.3 Grok 4.3 medium اجرا: 2026-05-01
اسکور 8.2 8.2
درجہ #21 #20
اعتماد پذیری دستیاب نہیں 10.0
تسلسل 9.5 8.6
درست ٹیسٹس
فی کوشش کامیابی کی شرح 75.9% 81.5%
غیر مستحکم ٹیسٹ 1 3
کل رنز 54 54
فی نتیجہ لاگت 2.454 3.974
کل لاگت $0.319 $0.517
?? ?? ???? $0.300 / 1M $1.250 / 1M
??? ?? ???? $2.500 / 1M $2.500 / 1M
آؤٹ پٹ ٹوکنز 1,898 1,223
ریزننگ ٹوکنز 122,273 187,047
ردِعمل کا وقت (اوسط) 12.12s 48.63s
ردِعمل کا وقت (زیادہ سے زیادہ) 95.48s 216.69s
ردِعمل کا وقت (کل) 218.12s 875.27s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 2.5 Flash 8.4 10.0 75.0% 0 6.30s 255 10,233
Grok 4.3 10.0 10.0 100.0% 0 8.83s 88 8,207
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 2.5 Flash 10.0 10.0 100.0% 0 16.23s 522 10,350
Grok 4.3 10.0 10.0 100.0% 0 45.72s 284 9,659
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 2.5 Flash 10.0 10.0 100.0% 0 28.44s 303 11,922
Grok 4.3 10.0 10.0 100.0% 0 63.99s 234 15,301
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 2.5 Flash 10.0 10.0 100.0% 0 4.06s 279 2,325
Grok 4.3 10.0 10.0 100.0% 0 18.97s 180 9,546
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 2.5 Flash 5.9 7.2 55.6% 1 37.34s 18 80,702
Grok 4.3 5.3 7.2 44.4% 1 181.74s 14 111,300
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 2.5 Flash 4.8 10.0 0.0% 0 4.86s 92 1,899
Grok 4.3 5.4 2.5 66.7% 1 24.70s 70 5,020
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 2.5 Flash 9.8 10.0 100.0% 0 2.62s 69 1,203
Grok 4.3 9.8 10.0 100.0% 0 18.58s 57 8,713
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 2.5 Flash 7.7 10.0 66.7% 0 3.94s 126 2,499
Grok 4.3 5.9 7.2 55.6% 1 22.53s 128 14,686
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 2.5 Flash 10.0 10.0 100.0% 0 6.20s 234 1,140
Grok 4.3 10.0 10.0 100.0% 0 17.66s 168 4,615

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں