नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

IBM: Granite 4.1 8B vs HY3 Preview

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-01

मेट्रिक Granite 4.1 8B Granite 4.1 8B none रिलीज़: 2026-05-01 HY3 Preview HY3 Preview none रिलीज़: 2026-04-22 निःशुल्क उपलब्ध
स्कोर 4.3 4.7
रैंक #135 #126
विश्वसनीयता 10.0 लागू नहीं
संगति 10.0 9.0
सही परीक्षण
प्रति प्रयास पास दर 11.1% 27.8%
अस्थिर टेस्ट 0 2
कुल रन 54 54
प्रति परिणाम लागत 0.110 0.000
कुल लागत $0.003 $0.000
???? ??? $0.050 / 1M $0.000 / 1M
????? ??? $0.100 / 1M $0.000 / 1M
आउटपुट टोकन 2,712 2,639
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 767ms 13.56s
प्रतिक्रिया समय (अधिकतम) 2.17s 35.84s
प्रतिक्रिया समय (कुल) 13.81s 230.55s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 4.9 10.0 25.0% 0 844ms 903 0
HY3 Preview 4.8 10.0 25.0% 0 11.10s 770 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 6.9 10.0 0.0% 0 1.07s 339 0
HY3 Preview 2.3 1.1 33.3% 1 4.56s 333 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 3.0 10.0 0.0% 0 1.88s 396 0
HY3 Preview 3.0 10.0 0.0% 0 35.84s 281 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 3.0 10.0 0.0% 0 575ms 195 0
HY3 Preview 6.5 10.0 50.0% 0 2.85s 117 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 3.0 10.0 0.0% 0 357ms 24 0
HY3 Preview 3.6 7.2 22.2% 1 17.61s 27 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 4.0 10.0 0.0% 0 499ms 115 0
HY3 Preview 4.1 10.0 0.0% 0 16.07s 150 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 3.6 9.9 0.0% 0 344ms 66 0
HY3 Preview 6.3 10.0 50.0% 0 12.98s 365 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 3.7 10.0 0.0% 0 635ms 431 0
HY3 Preview 3.3 10.0 0.0% 0 4.76s 359 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 10.0 10.0 100.0% 0 2.17s 243 0
HY3 Preview 10.0 10.0 100.0% 0 33.76s 237 0

त्वरित तुलना

तुलना जोड़ी बदलें