نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs Grok 4.20 Beta

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-26

میٹرک Gemini 3 Flash Preview Gemini 3 Flash Preview medium اجرا: 2025-12-17 Grok 4.20 Beta Grok 4.20 Beta medium اجرا: 2026-03-12
اسکور 10.0 8.0
درجہ #1 #31
اعتماد پذیری دستیاب نہیں دستیاب نہیں
تسلسل 10.0 9.1
درست ٹیسٹس
فی کوشش کامیابی کی شرح 100.0% 74.1%
غیر مستحکم ٹیسٹ 0 2
کل رنز 18 52
فی نتیجہ لاگت 0.600 5.269
کل لاگت $0.108 $0.633
?? ?? ???? $0.500 / 1M $0.000 / 1M
??? ?? ???? $3.000 / 1M $0.000 / 1M
آؤٹ پٹ ٹوکنز 655 1,568
ریزننگ ٹوکنز 33,749 91,909
ردِعمل کا وقت (اوسط) 12.11s 9.81s
ردِعمل کا وقت (زیادہ سے زیادہ) 82.37s 31.36s
ردِعمل کا وقت (کل) 217.93s 176.62s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.26s 110 1,076
Grok 4.20 Beta 8.7 7.9 91.7% 1 3.16s 268 7,583
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 82.37s 144 16,257
Grok 4.20 Beta 10.0 10.0 100.0% 0 31.36s 81 3,987
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 23.58s 117 3,495
Grok 4.20 Beta 10.0 10.0 100.0% 0 20.93s 227 12,212
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 7.62s 93 2,197
Grok 4.20 Beta 10.0 10.0 100.0% 0 4.01s 180 5,281
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 14.81s 4 7,228
Grok 4.20 Beta 5.3 10.0 33.3% 0 21.33s 251 40,255
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 6.34s 24 635
Grok 4.20 Beta 10.0 10.0 100.0% 0 5.78s 72 3,440
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.30s 24 903
Grok 4.20 Beta 8.3 10.0 50.0% 0 4.97s 57 7,107
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.86s 61 1,455
Grok 4.20 Beta 8.2 7.2 88.9% 1 3.85s 249 6,660
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 9.78s 78 503
Grok 4.20 Beta 3.0 10.0 0.0% 0 12.39s 183 5,384

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں