नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Google: Gemma 4 31B vs Z.ai: GLM 5

सारांश

Gemma 4 31B vs GLM 5 benchmark तुलना: Gemma 4 31B average score में आगे है: 6.3 vs 6.0. GLM 5 की benchmark लागत कम है: $0.027 vs $0.033. GLM 5 तेज है: 4.03s vs 56.55s, pass rates 69.8% vs 44.4%.

अनुशंसित मॉडल: GLM 5 - Its score stays close to the best score here (6.0 vs 6.3), while responding about 14.0x faster than Gemma 4 31B.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-02

मेट्रिक Gemma 4 31B Gemma 4 31B medium रिलीज़: 2026-04-02 निःशुल्क उपलब्ध GLM 5 GLM 5 none रिलीज़: 2026-02-12
स्कोर 6.3 6.0
रैंक #91 #104
विश्वसनीयता 10.0 10.0
संगति 9.4 9.7
सही परीक्षण
प्रति प्रयास पास दर 69.8% 44.4%
अस्थिर टेस्ट 1 1
कुल रन 63 63
प्रति परिणाम लागत 0.257 0.263
कुल लागत $0.033 $0.027
इनपुट कीमत $0.120 / 1M $0.600 / 1M
आउटपुट कीमत $0.350 / 1M $1.920 / 1M
कुल इनपुट टोकन 17,957 37,135
आउटपुट टोकन 22,356 1,989
रीजनिंग टोकन 65,726 0
प्रतिक्रिया समय (औसत) 56.55s 4.03s
प्रतिक्रिया समय (अधिकतम) 437.40s 11.07s
प्रतिक्रिया समय (कुल) 1074.41s 56.37s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#91 Gemma 4 31B

medium
लागत
$0.002
समय
45.7s
टोकन
2,696 tok

#104 GLM 5

none
लागत
$0.007
समय
32.1s
टोकन
2,023 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 12.89s 816 962 2,046
GLM 5 4.8 10.0 25.0% 0 2.37s 510 275 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 4.3 5.8 22.2% 1 219.76s 5,568 11,098 33,212
GLM 5 4.0 7.8 11.1% 1 5.12s 7,256 428 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
GLM 5 3.0 10.0 0.0% 0 4.98s 12,812 406 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 21.11s 8,334 1,822 2,951
GLM 5 10.0 10.0 100.0% 0 5.78s 7,107 203 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 7.7 10.0 66.7% 0 38.48s 876 4,349 8,985
GLM 5 3.0 10.0 0.0% 0 2.24s 643 19 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 9.57s 567 105 888
GLM 5 10.0 10.0 100.0% 0 3.27s 477 103 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 12.76s 777 533 2,035
GLM 5 10.0 10.0 100.0% 0 1.48s 636 61 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 9.9 10.0 100.0% 0 26.91s 801 1,795 5,595
GLM 5 7.7 10.0 66.7% 0 1.91s 609 261 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
GLM 5 10.0 10.0 100.0% 0 11.07s 6,899 220 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 3.0 10.0 0.0% 0 90.14s 218 1,692 10,014
GLM 5 3.0 10.0 0.0% 0 3.62s 186 13 0

त्वरित तुलना

तुलना जोड़ी बदलें