نیویگیشن
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs Grok 4.20 Beta

خلاصہ

Gemini 3 Flash Preview vs Grok 4.20 Beta benchmark موازنہ: Gemini 3 Flash Preview average score میں آگے ہے: 9.8 vs 8.5. Gemini 3 Flash Preview کی benchmark لاگت کم ہے: $0.667 vs $0.750. Grok 4.20 Beta تیز ہے: 9.75s vs 18.64s، pass rates 98.4% vs 81.5%.

تجویز کردہ ماڈل: Gemini 3 Flash Preview - It has the strongest score in this comparison (9.8) and the best overall balance of cost and response time across all 2 models.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-10

میٹرک Gemini 3 Flash Preview Gemini 3 Flash Preview medium اجرا: 2025-12-17 Grok 4.20 Beta Grok 4.20 Beta medium اجرا: 2026-03-12
اسکور 9.8 8.5
درجہ #1 #14
اعتماد پذیری 10.0 دستیاب نہیں
تسلسل 9.7 9.5
درست ٹیسٹس
فی کوشش کامیابی کی شرح 98.4% 81.5%
غیر مستحکم ٹیسٹ 1 1
کل رنز 63 52
فی نتیجہ لاگت 3.335 4.505
کل لاگت $0.667 $0.750
ان پٹ قیمت $0.500 / 1M $5.805 / 1M
آؤٹ پٹ قیمت $3.000 / 1M $5.805 / 1M
کل ان پٹ ٹوکنز 37,017 35,955
آؤٹ پٹ ٹوکنز 2,006 1,647
ریزننگ ٹوکنز 214,153 91,565
ردِعمل کا وقت (اوسط) 18.64s 9.75s
ردِعمل کا وقت (زیادہ سے زیادہ) 117.26s 31.36s
ردِعمل کا وقت (کل) 391.35s 175.48s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#1 Gemini 3 Flash Preview

medium
Cost
$0.010
Time
17.9s
Tokens
3,236 tok

#14 Grok 4.20 Beta

medium
Cost
$0.034
Time
91.0s
Tokens
13,523 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.88s 494 330 3,216
Grok 4.20 Beta 8.7 7.9 91.7% 1 3.16s 2,010 268 7,583
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3 Flash Preview 8.6 7.6 88.9% 1 84.40s 8,122 462 161,084
Grok 4.20 Beta 10.0 10.0 100.0% 0 31.36s 360 81 3,987
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 22.42s 12,873 351 10,485
Grok 4.20 Beta 10.0 10.0 100.0% 0 20.93s 12,909 227 12,212
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.43s 7,548 279 4,893
Grok 4.20 Beta 10.0 10.0 100.0% 0 4.01s 7,761 180 5,281
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 15.27s 633 12 21,684
Grok 4.20 Beta 5.3 10.0 33.3% 0 21.33s 1,764 251 40,255
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.19s 486 72 1,905
Grok 4.20 Beta 10.0 10.0 100.0% 0 5.78s 825 72 3,440
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.04s 615 72 2,709
Grok 4.20 Beta 9.8 10.0 100.0% 0 4.89s 1,362 57 7,123
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.05s 558 183 4,365
Grok 4.20 Beta 10.0 10.0 100.0% 0 3.52s 1,689 328 6,300
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 12.60s 5,532 234 1,487
Grok 4.20 Beta 3.0 10.0 0.0% 0 12.39s 7,275 183 5,384
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.50s 156 11 2,325
Grok 4.20 Beta - - - - - - - - -

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں