नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

IBM: Granite 4.1 8B vs xAI: Grok 4.20

सारांश

Granite 4.1 8B vs Grok 4.20 benchmark तुलना: Grok 4.20 average score मध्ये पुढे आहे: 5.3 vs 4.0. Granite 4.1 8B चा benchmark खर्च कमी आहे: $0.003 vs $0.057. Granite 4.1 8B वेगवान आहे: 728ms vs 1.11s, pass rates 9.5% vs 33.3%.

शिफारस केलेले मॉडेल: Granite 4.1 8B - It offers the best overall trade-off: a competitive score (4.0), lower cost than Grok 4.20, and balanced response time.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-12

मेट्रिक Granite 4.1 8B Granite 4.1 8B none प्रकाशन: 2026-05-01 Grok 4.20 Grok 4.20 none प्रकाशन: 2026-03-31
स्कोअर 4.0 5.3
क्रमांक #163 #130
विश्वसनीयता 10.0 लागू नाही
सुसंगतता 10.0 10.0
बरोबर चाचण्या
प्रति प्रयत्न पास दर 9.5% 33.3%
अस्थिर चाचण्या 0 0
एकूण रन 63 54
प्रति निकाल खर्च 0.131 1.570
एकूण खर्च $0.003 $0.057
इनपुट किंमत $0.050 / 1M $1.250 / 1M
आउटपुट किंमत $0.100 / 1M $2.500 / 1M
एकूण इनपुट टोकन्स 46,285 41,313
आउटपुट टोकन्स 2,911 1,923
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 728ms 1.11s
प्रतिसाद वेळ (कमाल) 2.17s 6.04s
प्रतिसाद वेळ (एकूण) 15.29s 19.96s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#163 IBM: Granite 4.1 8B

none
Cost
$0.001
Time
3.2s
Tokens
491 tok

#130 xAI: Grok 4.20

none
Cost
$0.004
Time
6.5s
Tokens
1,367 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Granite 4.1 8B 4.9 10.0 25.0% 0 844ms 645 903 0
Grok 4.20 4.8 10.0 25.0% 0 501ms 1,986 267 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Granite 4.1 8B 4.5 10.0 0.0% 0 775ms 8,344 525 0
Grok 4.20 3.4 9.3 0.0% 0 1.22s 1,074 312 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Granite 4.1 8B 3.0 10.0 0.0% 0 1.88s 19,089 396 0
Grok 4.20 3.0 10.0 0.0% 0 6.04s 17,673 282 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Granite 4.1 8B 3.0 10.0 0.0% 0 575ms 7,617 195 0
Grok 4.20 10.0 10.0 100.0% 0 522ms 7,749 207 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Granite 4.1 8B 3.0 10.0 0.0% 0 357ms 768 24 0
Grok 4.20 3.0 10.0 0.0% 0 687ms 1,746 325 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Granite 4.1 8B 4.0 10.0 0.0% 0 499ms 528 115 0
Grok 4.20 4.8 10.0 0.0% 0 659ms 819 83 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Granite 4.1 8B 3.6 9.9 0.0% 0 344ms 687 66 0
Grok 4.20 6.3 10.0 50.0% 0 445ms 1,350 60 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Granite 4.1 8B 3.2 10.0 0.0% 0 608ms 672 432 0
Grok 4.20 5.3 10.0 33.3% 0 473ms 1,671 198 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Granite 4.1 8B 10.0 10.0 100.0% 0 2.17s 7,719 243 0
Grok 4.20 10.0 10.0 100.0% 0 4.63s 7,245 189 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Granite 4.1 8B 3.0 10.0 0.0% 0 306ms 216 12 0
Grok 4.20 - - - - - - - - -

झटपट तुलना

तुलना जोडी बदला