نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.5 Flash vs xAI: Grok 4.3

خلاصہ

Gemini 3.5 Flash vs Grok 4.3 benchmark موازنہ: Grok 4.3 average score میں آگے ہے: 7.7 vs 7.0. Grok 4.3 کی benchmark لاگت کم ہے: $0.614 vs $1.079. Gemini 3.5 Flash تیز ہے: 9.93s vs 47.51s، pass rates 77.8% vs 71.4%.

تجویز کردہ ماڈل: Grok 4.3 - It has the best score here (7.7), while costing about 1.8x less than Gemini 3.5 Flash.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-12

میٹرک Gemini 3.5 Flash Gemini 3.5 Flash none اجرا: 2026-05-19 Grok 4.3 Grok 4.3 medium اجرا: 2026-05-01
اسکور 7.0 7.7
درجہ #66 #40
اعتماد پذیری 10.0 10.0
تسلسل 8.9 8.5
درست ٹیسٹس
فی کوشش کامیابی کی شرح 77.8% 71.4%
غیر مستحکم ٹیسٹ 3 4
کل رنز 63 63
فی نتیجہ لاگت 7.190 4.724
کل لاگت $1.079 $0.614
ان پٹ قیمت $1.500 / 1M $1.250 / 1M
آؤٹ پٹ قیمت $9.000 / 1M $2.500 / 1M
کل ان پٹ ٹوکنز 13,843 44,472
آؤٹ پٹ ٹوکنز 117,518 1,981
ریزننگ ٹوکنز 0 221,382
ردِعمل کا وقت (اوسط) 9.93s 47.51s
ردِعمل کا وقت (زیادہ سے زیادہ) 64.36s 216.69s
ردِعمل کا وقت (کل) 178.68s 997.68s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#66 Gemini 3.5 Flash

none
Cost
$0.225
Time
125.5s
Tokens
25,004 tok

#40 xAI: Grok 4.3

medium
Cost
$0.009
Time
19.0s
Tokens
3,661 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.53s 492 5,101 0
Grok 4.3 10.0 10.0 100.0% 0 8.83s 2,010 88 8,207
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 8.8 7.8 88.9% 1 34.69s 8,122 75,927 0
Grok 4.3 5.9 7.7 44.4% 1 41.23s 8,340 1,028 31,226
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 3.0 10.0 0.0% 0 0ms 0 0 0
Grok 4.3 10.0 10.0 100.0% 0 63.99s 12,909 234 15,301
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 6.5 10.0 50.0% 0 8.10s 2,781 5,895 0
Grok 4.3 10.0 10.0 100.0% 0 18.97s 7,761 180 9,546
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 7.6 7.2 77.8% 1 10.64s 633 17,910 0
Grok 4.3 5.3 7.2 44.4% 1 181.74s 1,764 14 111,300
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.46s 486 1,620 0
Grok 4.3 5.4 2.5 66.7% 1 24.70s 825 70 5,020
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 9.8 10.0 100.0% 0 3.38s 615 3,928 0
Grok 4.3 9.8 10.0 100.0% 0 18.58s 1,362 57 8,713
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.13s 558 4,640 0
Grok 4.3 5.9 7.2 55.6% 1 22.52s 1,689 128 14,468
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 3.0 10.0 0.0% 0 0ms 0 0 0
Grok 4.3 10.0 10.0 100.0% 0 17.66s 7,263 168 4,615
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 2.8 1.6 33.3% 1 4.87s 156 2,497 0
Grok 4.3 3.0 10.0 0.0% 0 44.47s 549 14 12,986

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں