नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

IBM: Granite 4.1 8B vs Z.ai: GLM 4.7 Flash

सारांश

Granite 4.1 8B vs GLM 4.7 Flash benchmark तुलना: GLM 4.7 Flash average score में आगे है: 4.3 vs 4.0. Granite 4.1 8B की benchmark लागत कम है: $0.003 vs $0.054. Granite 4.1 8B तेज है: 728ms vs 35.10s, pass rates 9.5% vs 33.3%.

अनुशंसित मॉडल: Granite 4.1 8B - Its score stays close to the best score here (4.0 vs 4.3), while costing about 20.5x less than GLM 4.7 Flash.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-12

मेट्रिक Granite 4.1 8B Granite 4.1 8B none रिलीज़: 2026-05-01 GLM 4.7 Flash GLM 4.7 Flash medium रिलीज़: 2026-01-19
स्कोर 4.0 4.3
रैंक #163 #159
विश्वसनीयता 10.0 6.7
संगति 10.0 6.8
सही परीक्षण
प्रति प्रयास पास दर 9.5% 33.3%
अस्थिर टेस्ट 0 8
कुल रन 63 63
प्रति परिणाम लागत 0.131 1.337
कुल लागत $0.003 $0.054
इनपुट कीमत $0.050 / 1M $0.060 / 1M
आउटपुट कीमत $0.100 / 1M $0.400 / 1M
कुल इनपुट टोकन 46,285 37,206
आउटपुट टोकन 2,911 43,754
रीजनिंग टोकन 0 89,079
प्रतिक्रिया समय (औसत) 728ms 35.10s
प्रतिक्रिया समय (अधिकतम) 2.17s 174.55s
प्रतिक्रिया समय (कुल) 15.29s 456.24s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#163 IBM: Granite 4.1 8B

none
Cost
$0.001
Time
3.2s
Tokens
491 tok

#159 GLM 4.7 Flash

medium
Invalid SVG
Cost
$0.000
Time
186.2s
Tokens
12,112 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 4.9 10.0 25.0% 0 844ms 645 903 0
GLM 4.7 Flash 4.7 5.9 41.7% 2 14.95s 555 1,122 6,110
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 4.5 10.0 0.0% 0 775ms 8,344 525 0
GLM 4.7 Flash 3.2 7.4 11.1% 1 55.33s 3,106 4,981 22,387
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 3.0 10.0 0.0% 0 1.88s 19,089 396 0
GLM 4.7 Flash 2.8 2.1 33.3% 1 65.57s 17,185 2,585 20,648
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 3.0 10.0 0.0% 0 575ms 7,617 195 0
GLM 4.7 Flash 6.3 10.0 50.0% 0 1.51s 7,107 584 2,755
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 3.0 10.0 0.0% 0 357ms 768 24 0
GLM 4.7 Flash 3.5 4.4 33.3% 2 174.55s 643 33,000 25,394
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 4.0 10.0 0.0% 0 499ms 528 115 0
GLM 4.7 Flash 3.6 9.7 0.0% 0 18.14s 318 18 2,138
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 3.6 9.9 0.0% 0 344ms 687 66 0
GLM 4.7 Flash 6.2 5.8 66.7% 1 2.97s 636 388 2,181
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 3.2 10.0 0.0% 0 608ms 672 432 0
GLM 4.7 Flash 2.9 7.2 11.1% 1 12.93s 521 781 5,255
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 10.0 10.0 100.0% 0 2.17s 7,719 243 0
GLM 4.7 Flash 10.0 10.0 100.0% 0 15.95s 6,949 224 1,014
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Granite 4.1 8B 3.0 10.0 0.0% 0 306ms 216 12 0
GLM 4.7 Flash 3.0 10.0 0.0% 0 11.13s 186 71 1,197

त्वरित तुलना

तुलना जोड़ी बदलें