नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Mistral: Mistral Small 4 vs Z.ai: GLM 4.7 Flash

सारांश

Mistral Small 4 vs GLM 4.7 Flash benchmark तुलना: Mistral Small 4 average score में आगे है: 5.1 vs 4.3. Mistral Small 4 की benchmark लागत कम है: $0.007 vs $0.054. Mistral Small 4 तेज है: 630ms vs 35.10s, pass rates 27.0% vs 33.3%.

अनुशंसित मॉडल: Mistral Small 4 - It has the best score here (5.1), while costing about 7.7x less than GLM 4.7 Flash.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-12

मेट्रिक Mistral Small 4 Mistral Small 4 none रिलीज़: 2026-03-16 GLM 4.7 Flash GLM 4.7 Flash medium रिलीज़: 2026-01-19
स्कोर 5.1 4.3
रैंक #136 #159
विश्वसनीयता 10.0 6.7
संगति 9.5 6.8
सही परीक्षण
प्रति प्रयास पास दर 27.0% 33.3%
अस्थिर टेस्ट 1 8
कुल रन 63 63
प्रति परिणाम लागत 0.139 1.337
कुल लागत $0.007 $0.054
इनपुट कीमत $0.150 / 1M $0.060 / 1M
आउटपुट कीमत $0.600 / 1M $0.400 / 1M
कुल इनपुट टोकन 37,309 37,206
आउटपुट टोकन 2,201 43,754
रीजनिंग टोकन 0 89,079
प्रतिक्रिया समय (औसत) 630ms 35.10s
प्रतिक्रिया समय (अधिकतम) 1.72s 174.55s
प्रतिक्रिया समय (कुल) 13.22s 456.24s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#136 Mistral Small 4

none
Cost
$0.002
Time
10.4s
Tokens
2,370 tok

#159 GLM 4.7 Flash

medium
Invalid SVG
Cost
$0.000
Time
186.2s
Tokens
12,112 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.4 7.9 16.7% 1 395ms 708 182 0
GLM 4.7 Flash 4.7 5.9 41.7% 2 14.95s 555 1,122 6,110
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.7 9.7 0.0% 0 901ms 7,636 619 0
GLM 4.7 Flash 3.2 7.4 11.1% 1 55.33s 3,106 4,981 22,387
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.0 10.0 0.0% 0 1.72s 11,640 496 0
GLM 4.7 Flash 2.8 2.1 33.3% 1 65.57s 17,185 2,585 20,648
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 10.0 10.0 100.0% 0 822ms 7,914 261 0
GLM 4.7 Flash 6.3 10.0 50.0% 0 1.51s 7,107 584 2,755
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 5.3 10.0 33.3% 0 367ms 798 28 0
GLM 4.7 Flash 3.5 4.4 33.3% 2 174.55s 643 33,000 25,394
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 4.0 10.0 0.0% 0 729ms 519 205 0
GLM 4.7 Flash 3.6 9.7 0.0% 0 18.14s 318 18 2,138
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 6.5 10.0 50.0% 0 380ms 729 69 0
GLM 4.7 Flash 6.2 5.8 66.7% 1 2.97s 636 388 2,181
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.1 9.9 0.0% 0 399ms 735 111 0
GLM 4.7 Flash 2.9 7.2 11.1% 1 12.93s 521 781 5,255
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 10.0 10.0 100.0% 0 1.40s 6,420 213 0
GLM 4.7 Flash 10.0 10.0 100.0% 0 15.95s 6,949 224 1,014
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.0 10.0 0.0% 0 397ms 210 17 0
GLM 4.7 Flash 3.0 10.0 0.0% 0 11.13s 186 71 1,197

त्वरित तुलना

तुलना जोड़ी बदलें