نیویگیشن
AI BENCHY
Advertise here

AI BENCHY Compare

IBM: Granite 4.1 8B vs Qwen: Qwen3.6 Flash

خلاصہ

Granite 4.1 8B vs Qwen3.6 Flash benchmark موازنہ: Qwen3.6 Flash average score میں آگے ہے: 6.0 vs 4.0. Granite 4.1 8B کی benchmark لاگت کم ہے: $0.003 vs $0.015. Granite 4.1 8B تیز ہے: 728ms vs 1.60s، pass rates 9.5% vs 33.3%.

تجویز کردہ ماڈل: Granite 4.1 8B - It offers the best overall trade-off: a competitive score (4.0), lower cost than Qwen3.6 Flash, and balanced response time.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-18

میٹرک Granite 4.1 8B Granite 4.1 8B none اجرا: 2026-05-01 Qwen3.6 Flash Qwen3.6 Flash none اجرا: 2026-04-20
اسکور 4.0 6.0
درجہ #163 #102
اعتماد پذیری 10.0 10.0
تسلسل 10.0 10.0
درست ٹیسٹس
فی کوشش کامیابی کی شرح 9.5% 33.3%
غیر مستحکم ٹیسٹ 0 0
کل رنز 63 63
فی نتیجہ لاگت 0.131 0.266
کل لاگت $0.003 $0.015
ان پٹ قیمت $0.050 / 1M $0.188 / 1M
آؤٹ پٹ قیمت $0.100 / 1M $1.125 / 1M
کل ان پٹ ٹوکنز 46,285 50,810
آؤٹ پٹ ٹوکنز 2,911 4,164
ریزننگ ٹوکنز 0 0
ردِعمل کا وقت (اوسط) 728ms 1.60s
ردِعمل کا وقت (زیادہ سے زیادہ) 2.17s 4.60s
ردِعمل کا وقت (کل) 15.29s 33.59s

جنریشن شوکیس

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#163 IBM: Granite 4.1 8B

none
لاگت
$0.001
وقت
3.2s
ٹوکنز
491 tok

#102 Qwen3.6 Flash

none
لاگت
$0.005
وقت
20.1s
ٹوکنز
4,211 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Granite 4.1 8B 4.9 10.0 25.0% 0 844ms 645 903 0
Qwen3.6 Flash 3.1 10.0 0.0% 0 1.63s 696 1,554 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Granite 4.1 8B 4.5 10.0 0.0% 0 775ms 8,344 525 0
Qwen3.6 Flash 5.4 10.0 33.3% 0 1.79s 6,488 889 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Granite 4.1 8B 3.0 10.0 0.0% 0 1.88s 19,089 396 0
Qwen3.6 Flash 3.0 10.0 0.0% 0 4.22s 24,675 315 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Granite 4.1 8B 3.0 10.0 0.0% 0 575ms 7,617 195 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 2.13s 7,794 243 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Granite 4.1 8B 3.0 10.0 0.0% 0 357ms 768 24 0
Qwen3.6 Flash 5.3 10.0 33.3% 0 1.11s 789 15 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Granite 4.1 8B 4.0 10.0 0.0% 0 499ms 528 115 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 947ms 522 132 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Granite 4.1 8B 3.6 9.9 0.0% 0 344ms 687 66 0
Qwen3.6 Flash 6.3 10.0 50.0% 0 1.10s 711 66 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Granite 4.1 8B 3.2 10.0 0.0% 0 608ms 672 432 0
Qwen3.6 Flash 3.5 10.0 0.0% 0 1.21s 714 669 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Granite 4.1 8B 10.0 10.0 100.0% 0 2.17s 7,719 243 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 2.49s 8,211 272 0
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Granite 4.1 8B 3.0 10.0 0.0% 0 306ms 216 12 0
Qwen3.6 Flash 3.0 10.0 0.0% 0 649ms 210 9 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں