नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

IBM: Granite 4.1 8B vs HY3 Preview

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-01

मेट्रिक Granite 4.1 8B Granite 4.1 8B none रिलीज़: 2026-05-01 HY3 Preview HY3 Preview high रिलीज़: 2026-04-22 निःशुल्क उपलब्ध
स्कोर 4.3 8.6
रैंक #135 #10
विश्वसनीयता 10.0 लागू नहीं
संगति 10.0 9.2
सही परीक्षण
प्रति प्रयास पास दर 11.1% 83.3%
अस्थिर टेस्ट 0 2
कुल रन 54 50
प्रति परिणाम लागत 0.110 0.000
कुल लागत $0.003 $0.000
???? ??? $0.050 / 1M $0.000 / 1M
????? ??? $0.100 / 1M $0.000 / 1M
आउटपुट टोकन 2,712 238,920
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 767ms 55.19s
प्रतिक्रिया समय (अधिकतम) 2.17s 149.94s
प्रतिक्रिया समय (कुल) 13.81s 938.23s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 4.9 10.0 25.0% 0 844ms 903 0
HY3 Preview 10.0 10.0 100.0% 0 32.69s 26,550 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 6.9 10.0 0.0% 0 1.07s 339 0
HY3 Preview 10.0 10.0 100.0% 0 99.76s 38,167 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 3.0 10.0 0.0% 0 1.88s 396 0
HY3 Preview 10.0 10.0 100.0% 0 113.09s 31,319 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 3.0 10.0 0.0% 0 575ms 195 0
HY3 Preview 6.5 10.0 50.0% 0 12.11s 4,323 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 3.0 10.0 0.0% 0 357ms 24 0
HY3 Preview 5.3 7.2 44.4% 1 109.04s 87,559 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 4.0 10.0 0.0% 0 499ms 115 0
HY3 Preview 10.0 10.0 100.0% 0 24.31s 5,490 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 3.6 9.9 0.0% 0 344ms 66 0
HY3 Preview 9.9 10.0 100.0% 0 34.02s 13,331 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 3.7 10.0 0.0% 0 635ms 431 0
HY3 Preview 9.0 7.9 88.9% 1 28.07s 21,811 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 10.0 10.0 100.0% 0 2.17s 243 0
HY3 Preview 10.0 10.0 100.0% 0 78.83s 10,370 0

त्वरित तुलना

तुलना जोड़ी बदलें