نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.5 Flash vs IBM: Granite 4.1 8B

خلاصہ

Gemini 3.5 Flash vs Granite 4.1 8B benchmark موازنہ: Gemini 3.5 Flash average score میں آگے ہے: 9.2 vs 4.0. Granite 4.1 8B کی benchmark لاگت کم ہے: $0.003 vs $0.349. Granite 4.1 8B تیز ہے: 728ms vs 3.27s، pass rates 90.5% vs 9.5%.

تجویز کردہ ماڈل: Gemini 3.5 Flash - It has the strongest score in this comparison (9.2) and the best overall balance of cost and response time across all 2 models.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-18

میٹرک Gemini 3.5 Flash Gemini 3.5 Flash low اجرا: 2026-05-19 Granite 4.1 8B Granite 4.1 8B none اجرا: 2026-05-01
اسکور 9.2 4.0
درجہ #5 #163
اعتماد پذیری 10.0 10.0
تسلسل 10.0 10.0
درست ٹیسٹس
فی کوشش کامیابی کی شرح 90.5% 9.5%
غیر مستحکم ٹیسٹ 0 0
کل رنز 63 63
فی نتیجہ لاگت 1.834 0.131
کل لاگت $0.349 $0.003
ان پٹ قیمت $1.500 / 1M $0.050 / 1M
آؤٹ پٹ قیمت $9.000 / 1M $0.100 / 1M
کل ان پٹ ٹوکنز 36,938 46,285
آؤٹ پٹ ٹوکنز 2,033 2,911
ریزننگ ٹوکنز 30,519 0
ردِعمل کا وقت (اوسط) 3.27s 728ms
ردِعمل کا وقت (زیادہ سے زیادہ) 9.05s 2.17s
ردِعمل کا وقت (کل) 68.65s 15.29s

جنریشن شوکیس

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#5 Gemini 3.5 Flash

low
لاگت
$0.068
وقت
39.1s
ٹوکنز
7,588 tok

#163 IBM: Granite 4.1 8B

none
لاگت
$0.001
وقت
3.2s
ٹوکنز
491 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.52s 494 209 2,536
Granite 4.1 8B 4.9 10.0 25.0% 0 844ms 645 903 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 7.8 10.0 66.7% 0 6.71s 8,118 458 13,420
Granite 4.1 8B 4.5 10.0 0.0% 0 775ms 8,344 525 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.44s 12,873 351 3,050
Granite 4.1 8B 3.0 10.0 0.0% 0 1.88s 19,089 396 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.81s 7,548 279 1,164
Granite 4.1 8B 3.0 10.0 0.0% 0 575ms 7,617 195 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 7.7 10.0 66.7% 0 3.39s 633 12 4,538
Granite 4.1 8B 3.0 10.0 0.0% 0 357ms 768 24 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.27s 486 119 916
Granite 4.1 8B 4.0 10.0 0.0% 0 499ms 528 115 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 9.9 10.0 100.0% 0 1.86s 615 71 1,652
Granite 4.1 8B 3.6 9.9 0.0% 0 344ms 687 66 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.35s 558 288 2,150
Granite 4.1 8B 3.2 10.0 0.0% 0 608ms 672 432 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.27s 5,457 234 403
Granite 4.1 8B 10.0 10.0 100.0% 0 2.17s 7,719 243 0
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.88s 156 12 690
Granite 4.1 8B 3.0 10.0 0.0% 0 306ms 216 12 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں