नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Mistral: Mistral Small 4 vs xAI: Grok 4.20 Beta

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-17

मेट्रिक Mistral Small 4 Mistral Small 4 medium रिलीज़: 2026-03-16 Grok 4.20 Beta Grok 4.20 Beta none रिलीज़: 2026-03-12
रैंक #55 #58
स्कोर 5.6 5.3
संगति 7.0 9.1
प्रति परिणाम लागत 0.502 2.240
कुल लागत $0.026 $0.090
सही परीक्षण
प्रति प्रयास पास दर 49.0% 31.4%
अस्थिर टेस्ट 6 2
कुल रन 51 51
आउटपुट टोकन 12,288 1,517
रीजनिंग टोकन 28,112 0
प्रतिक्रिया समय (औसत) 4.18s 1.19s
प्रतिक्रिया समय (अधिकतम) 25.25s 6.48s
प्रतिक्रिया समय (कुल) 71.03s 20.22s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 5.6 3.8 66.7% 3 2.67s 4,055 4,778
Grok 4.20 Beta 4.0 8.4 16.7% 1 597ms 251 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.0 10.0 0.0% 0 25.25s 2,612 10,700
Grok 4.20 Beta 3.0 10.0 0.0% 0 6.48s 282 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 7.3 5.9 83.3% 1 1.23s 335 723
Grok 4.20 Beta 10.0 10.0 100.0% 0 601ms 197 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 5.3 7.2 44.4% 1 6.11s 2,621 6,904
Grok 4.20 Beta 3.0 10.0 0.0% 0 611ms 160 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 4.8 10.0 0.0% 0 2.05s 821 828
Grok 4.20 Beta 5.0 10.0 0.0% 0 541ms 87 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 7.3 5.8 83.3% 1 1.38s 540 1,031
Grok 4.20 Beta 4.8 10.0 0.0% 0 687ms 60 0
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.4 9.7 0.0% 0 2.00s 983 2,338
Grok 4.20 Beta 5.9 7.2 55.6% 1 541ms 291 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 10.0 10.0 100.0% 0 3.50s 321 810
Grok 4.20 Beta 10.0 10.0 100.0% 0 4.79s 189 0

त्वरित तुलना

तुलना जोड़ी बदलें