نیویگیشن
AI BENCHY
Advertise here

AI BENCHY Compare

IBM: Granite 4.1 8B vs xAI: Grok 4.20

خلاصہ

Granite 4.1 8B vs Grok 4.20 benchmark موازنہ: Grok 4.20 average score میں آگے ہے: 5.3 vs 4.0. Granite 4.1 8B کی benchmark لاگت کم ہے: $0.003 vs $0.057. Granite 4.1 8B تیز ہے: 728ms vs 1.11s، pass rates 9.5% vs 33.3%.

تجویز کردہ ماڈل: Granite 4.1 8B - It offers the best overall trade-off: a competitive score (4.0), lower cost than Grok 4.20, and balanced response time.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-12

میٹرک Granite 4.1 8B Granite 4.1 8B none اجرا: 2026-05-01 Grok 4.20 Grok 4.20 none اجرا: 2026-03-31
اسکور 4.0 5.3
درجہ #163 #130
اعتماد پذیری 10.0 دستیاب نہیں
تسلسل 10.0 10.0
درست ٹیسٹس
فی کوشش کامیابی کی شرح 9.5% 33.3%
غیر مستحکم ٹیسٹ 0 0
کل رنز 63 54
فی نتیجہ لاگت 0.131 1.570
کل لاگت $0.003 $0.057
ان پٹ قیمت $0.050 / 1M $1.250 / 1M
آؤٹ پٹ قیمت $0.100 / 1M $2.500 / 1M
کل ان پٹ ٹوکنز 46,285 41,313
آؤٹ پٹ ٹوکنز 2,911 1,923
ریزننگ ٹوکنز 0 0
ردِعمل کا وقت (اوسط) 728ms 1.11s
ردِعمل کا وقت (زیادہ سے زیادہ) 2.17s 6.04s
ردِعمل کا وقت (کل) 15.29s 19.96s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#163 IBM: Granite 4.1 8B

none
Cost
$0.001
Time
3.2s
Tokens
491 tok

#130 xAI: Grok 4.20

none
Cost
$0.004
Time
6.5s
Tokens
1,367 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Granite 4.1 8B 4.9 10.0 25.0% 0 844ms 645 903 0
Grok 4.20 4.8 10.0 25.0% 0 501ms 1,986 267 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Granite 4.1 8B 4.5 10.0 0.0% 0 775ms 8,344 525 0
Grok 4.20 3.4 9.3 0.0% 0 1.22s 1,074 312 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Granite 4.1 8B 3.0 10.0 0.0% 0 1.88s 19,089 396 0
Grok 4.20 3.0 10.0 0.0% 0 6.04s 17,673 282 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Granite 4.1 8B 3.0 10.0 0.0% 0 575ms 7,617 195 0
Grok 4.20 10.0 10.0 100.0% 0 522ms 7,749 207 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Granite 4.1 8B 3.0 10.0 0.0% 0 357ms 768 24 0
Grok 4.20 3.0 10.0 0.0% 0 687ms 1,746 325 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Granite 4.1 8B 4.0 10.0 0.0% 0 499ms 528 115 0
Grok 4.20 4.8 10.0 0.0% 0 659ms 819 83 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Granite 4.1 8B 3.6 9.9 0.0% 0 344ms 687 66 0
Grok 4.20 6.3 10.0 50.0% 0 445ms 1,350 60 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Granite 4.1 8B 3.2 10.0 0.0% 0 608ms 672 432 0
Grok 4.20 5.3 10.0 33.3% 0 473ms 1,671 198 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Granite 4.1 8B 10.0 10.0 100.0% 0 2.17s 7,719 243 0
Grok 4.20 10.0 10.0 100.0% 0 4.63s 7,245 189 0
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Granite 4.1 8B 3.0 10.0 0.0% 0 306ms 216 12 0
Grok 4.20 - - - - - - - - -

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں