नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Mistral: Mistral Small 4 vs Z.ai: GLM 4.7 Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-17

मेट्रिक Mistral Small 4 Mistral Small 4 medium रिलीज़: 2026-03-16 GLM 4.7 Flash GLM 4.7 Flash none रिलीज़: 2026-01-19
रैंक #55 #57
स्कोर 5.6 5.6
संगति 7.0 8.5
प्रति परिणाम लागत 0.502 0.053
कुल लागत $0.026 $0.003
सही परीक्षण
प्रति प्रयास पास दर 49.0% 39.2%
अस्थिर टेस्ट 6 3
कुल रन 51 51
आउटपुट टोकन 12,288 1,863
रीजनिंग टोकन 28,112 0
प्रतिक्रिया समय (औसत) 4.18s 3.13s
प्रतिक्रिया समय (अधिकतम) 25.25s 7.05s
प्रतिक्रिया समय (कुल) 71.03s 31.33s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 5.6 3.8 66.7% 3 2.67s 4,055 4,778
GLM 4.7 Flash 5.2 7.9 41.7% 1 5.51s 438 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.0 10.0 0.0% 0 25.25s 2,612 10,700
GLM 4.7 Flash 3.0 10.0 0.0% 0 3.22s 704 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 7.3 5.9 83.3% 1 1.23s 335 723
GLM 4.7 Flash 7.3 5.8 83.3% 1 4.82s 196 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 5.3 7.2 44.4% 1 6.11s 2,621 6,904
GLM 4.7 Flash 7.7 10.0 66.7% 0 744ms 19 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 4.8 10.0 0.0% 0 2.05s 821 828
GLM 4.7 Flash 4.0 10.0 0.0% 0 1.59s 134 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 7.3 5.8 83.3% 1 1.38s 540 1,031
GLM 4.7 Flash 6.5 10.0 50.0% 0 888ms 62 0
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.4 9.7 0.0% 0 2.00s 983 2,338
GLM 4.7 Flash 4.4 10.0 0.0% 0 1.00s 98 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 10.0 10.0 100.0% 0 3.50s 321 810
GLM 4.7 Flash 2.8 1.6 33.3% 1 7.05s 212 0

त्वरित तुलना

तुलना जोड़ी बदलें