नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

xAI: Grok 4.20 vs Z.ai: GLM 5V Turbo

सारांश

Grok 4.20 vs GLM 5V Turbo benchmark तुलना: Grok 4.20 average score में आगे है: 7.3 vs 7.3. GLM 5V Turbo की benchmark लागत कम है: $0.457 vs $0.609. GLM 5V Turbo तेज है: 23.08s vs 27.68s, pass rates 63.5% vs 68.3%.

अनुशंसित मॉडल: GLM 5V Turbo - It offers the best overall trade-off: a competitive score (7.3), lower cost than Grok 4.20, and balanced response time.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक Grok 4.20 Grok 4.20 medium रिलीज़: 2026-03-31 GLM 5V Turbo GLM 5V Turbo medium रिलीज़: 2026-04-01
स्कोर 7.3 7.3
रैंक #53 #56
विश्वसनीयता 10.0 10.0
संगति 8.8 7.9
सही परीक्षण
प्रति प्रयास पास दर 63.5% 68.3%
अस्थिर टेस्ट 3 6
कुल रन 63 63
प्रति परिणाम लागत 8.309 4.151
कुल लागत $0.609 $0.457
इनपुट कीमत $1.250 / 1M $1.200 / 1M
आउटपुट कीमत $2.500 / 1M $4.000 / 1M
कुल इनपुट टोकन 44,433 44,615
आउटपुट टोकन 1,819 2,347
रीजनिंग टोकन 219,524 98,415
प्रतिक्रिया समय (औसत) 27.68s 23.08s
प्रतिक्रिया समय (अधिकतम) 199.66s 95.88s
प्रतिक्रिया समय (कुल) 581.26s 484.63s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#53 xAI: Grok 4.20

medium
लागत
$0.041
समय
110.3s
टोकन
16,336 tok

#56 GLM 5V Turbo

medium
अमान्य SVG
लागत
$0.000
समय
300.0s
टोकन
0 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 8.2 7.9 83.3% 1 3.95s 2,010 287 8,312
GLM 5V Turbo 7.2 6.1 75.0% 2 10.76s 555 587 7,872
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 6.3 6.6 55.6% 1 109.93s 8,307 268 103,150
GLM 5V Turbo 6.0 7.2 55.6% 1 63.38s 7,256 440 37,873
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 10.0 10.0 100.0% 0 17.40s 12,909 232 9,556
GLM 5V Turbo 6.9 3.8 66.7% 1 15.06s 18,533 403 2,523
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 10.0 10.0 100.0% 0 4.17s 7,761 180 5,333
GLM 5V Turbo 10.0 10.0 100.0% 0 9.60s 7,107 236 4,333
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 5.3 10.0 33.3% 0 27.03s 1,764 375 49,339
GLM 5V Turbo 5.3 7.2 44.4% 1 38.15s 687 32 29,035
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 3.9 2.6 33.3% 1 24.48s 825 65 6,440
GLM 5V Turbo 10.0 10.0 100.0% 0 11.09s 477 131 2,183
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 9.8 10.0 100.0% 0 4.26s 1,362 57 6,419
GLM 5V Turbo 9.9 10.0 100.0% 0 3.74s 636 72 1,813
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 7.7 10.0 66.7% 0 6.22s 1,689 149 7,913
GLM 5V Turbo 7.7 10.0 66.7% 0 10.24s 609 131 4,496
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 3.0 10.0 0.0% 0 13.68s 7,275 197 6,620
GLM 5V Turbo 7.0 3.7 66.7% 1 12.53s 8,569 293 765
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 3.0 10.0 0.0% 0 63.48s 531 9 16,442
GLM 5V Turbo 3.0 10.0 0.0% 0 40.96s 186 22 7,522

त्वरित तुलना

तुलना जोड़ी बदलें