#224

Granite 4.1 8B

IBM Granite रिलीज़: 2026-05-01 परीक्षण किया गया: 2026-07-16 23:04 ibm-granite/granite-4.1-8b::none

सारांश

Granite 4.1 8B AI BENCHY पर 4.0 स्कोर करता है और #224 पर है। इसकी reliability 10.0, pass rate 9.1%, कुल लागत $0.007, और औसत response time 1.45s है।

Granite 4.1 8B को अलग क्या बनाता है: इस score range के लिए इसकी कुल benchmark लागत असामान्य रूप से कम है। यह समान मॉडलों की तुलना में काफ़ी तेज है।

स्कोर

4.0

संगति

10.0

विश्वसनीयता

10.0

कुल लागत (वर्तमान कीमत)

$0.007

कुल आउटपुट टोकन

5,996

कुल इनपुट टोकन

113,827

इनपुट कीमत

$0.050 / 1M

आउटपुट कीमत

$0.100 / 1M

सही परीक्षण

गलत टेस्ट: 20

प्रति प्रयास पास दर: 9.1%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

1.45s

प्रतिक्रिया समय (अधिकतम): 16.67s

प्रतिक्रिया समय (कुल): 31.96s

गलत उत्तर: 13 निर्देशों का पालन नहीं किया: 4 अमान्य टूल कॉल: 2 अतिरिक्त फॉर्मेटिंग: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#224 IBM: Granite 4.1 8B

none

लागत: $0.001
समय: 3.2s
टोकन: 491 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-07-16 23:04 नया टेस्ट जोड़ा गया	4.0	10.0	$0.007	वर्तमान रन
2026-06-04 14:07 नया टेस्ट जोड़ा गया	4.0	10.0	$0.003	तुलना करें
2026-05-22 00:30 सूट बदला गया	4.1	10.0	$0.003	तुलना करें
2026-05-01 00:31 पहला रन	4.3	10.0	$0.003	तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

रन तुलना

रन	स्कोर	संगति	विश्वसनीयता	सही परीक्षण	कुल आउटपुट टोकन	कुल इनपुट टोकन	कुल लागत	प्रतिक्रिया समय (औसत)
2026-07-16 23:04 · वर्तमान रन	4.0	10.0	10.0	2/22	5,996	113,827	$0.007	1.45s
2026-05-01 00:31 · पहला रन	4.3	10.0	10.0	2/18	2,712	0	$0.003	767ms
अंतर	-0.3	0.0	0.0	0	+3284	+113827	+$0.005	+686ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख	इनपुट कीमत	आउटपुट कीमत
2026-06-04 15:40	$0.050 / 1M	$0.100 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

Granite 4.1 8BnonevsGrok 4.20none Granite 4.1 8BnonevsQwen3.5-9Bmedium Granite 4.1 8BnonevsGLM 4.7 Flashmedium Granite 4.1 8Bnonevsgpt-oss-120bnoneनिःशुल्क उपलब्ध Granite 4.1 8BnonevsLaguna S 2.1noneनिःशुल्क उपलब्ध Granite 4.1 8BnonevsMiniMax M2.5medium Granite 4.1 8BnonevsMercury 2none Granite 4.1 8BnonevsCobuddymedium Granite 4.1 8BnonevsQwen3 Coder Nextmedium Granite 4.1 8BnonevsTrinity Large Previewnone

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	4.9	10.0
कोडिंग	4.5	10.0
संयुक्त	3.0	10.0
डेटा पार्सिंग और निष्कर्षण	3.0	10.0
डोमेन-विशिष्ट	3.0	10.0
Samanya Buddhimatta	4.0	10.0
निर्देश पालन	3.6	9.9
पहेली समाधान	3.2	10.0
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

Granite 4.1 8B

Hamster playing table tennis

#224 IBM: Granite 4.1 8B

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल