नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

IBM: Granite 4.1 8B vs OpenAI: GPT-5.5

सारांश

Granite 4.1 8B vs GPT-5.5 benchmark तुलना: GPT-5.5 average score में आगे है: 9.3 vs 4.0. Granite 4.1 8B की benchmark लागत कम है: $0.003 vs $0.907. Granite 4.1 8B तेज है: 728ms vs 9.76s, pass rates 9.5% vs 85.7%.

अनुशंसित मॉडल: Granite 4.1 8B - It offers the best overall trade-off: a competitive score (4.0), lower cost than GPT-5.5, and balanced response time.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-12

मेट्रिक Granite 4.1 8B Granite 4.1 8B none रिलीज़: 2026-05-01 GPT-5.5 GPT-5.5 low रिलीज़: 2026-04-24
स्कोर 4.0 9.3
रैंक #163 #5
विश्वसनीयता 10.0 10.0
संगति 10.0 10.0
सही परीक्षण
प्रति प्रयास पास दर 9.5% 85.7%
अस्थिर टेस्ट 0 0
कुल रन 63 63
प्रति परिणाम लागत 0.131 5.035
कुल लागत $0.003 $0.907
इनपुट कीमत $0.050 / 1M $5.000 / 1M
आउटपुट कीमत $0.100 / 1M $30.000 / 1M
कुल इनपुट टोकन 46,285 34,209
आउटपुट टोकन 2,911 2,046
रीजनिंग टोकन 0 22,460
प्रतिक्रिया समय (औसत) 728ms 9.76s
प्रतिक्रिया समय (अधिकतम) 2.17s 56.19s
प्रतिक्रिया समय (कुल) 15.29s 204.92s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#163 IBM: Granite 4.1 8B

none
Cost
$0.001
Time
3.2s
Tokens
491 tok

#5 GPT-5.5

low
Cost
$0.068
Time
37.0s
Tokens
2,339 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 4.9 10.0 25.0% 0 844ms 645 903 0
GPT-5.5 10.0 10.0 100.0% 0 4.41s 606 238 1,020
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 4.5 10.0 0.0% 0 775ms 8,344 525 0
GPT-5.5 10.0 10.0 100.0% 0 15.04s 7,302 423 6,402
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 3.0 10.0 0.0% 0 1.88s 19,089 396 0
GPT-5.5 10.0 10.0 100.0% 0 9.56s 11,019 303 717
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 3.0 10.0 0.0% 0 575ms 7,617 195 0
GPT-5.5 10.0 10.0 100.0% 0 3.28s 7,140 228 157
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 3.0 10.0 0.0% 0 357ms 768 24 0
GPT-5.5 5.3 10.0 33.3% 0 28.05s 723 69 11,609
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 4.0 10.0 0.0% 0 499ms 528 115 0
GPT-5.5 10.0 10.0 100.0% 0 5.17s 477 133 245
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 3.6 9.9 0.0% 0 344ms 687 66 0
GPT-5.5 9.9 10.0 100.0% 0 3.74s 660 93 415
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 3.2 10.0 0.0% 0 608ms 672 432 0
GPT-5.5 10.0 10.0 100.0% 0 4.74s 642 279 954
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 10.0 10.0 100.0% 0 2.17s 7,719 243 0
GPT-5.5 10.0 10.0 100.0% 0 4.96s 5,445 250 101
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 3.0 10.0 0.0% 0 306ms 216 12 0
GPT-5.5 3.0 10.0 0.0% 0 10.06s 195 30 840

त्वरित तुलना

तुलना जोड़ी बदलें