नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Inception: Mercury 2 vs Mistral: Mistral Small 4

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-16

मेट्रिक Mercury 2 Mercury 2 none रिलीज़: 2026-02-24 Mistral Small 4 Mistral Small 4 none रिलीज़: 2026-03-16
स्कोर 4.8 5.2
रैंक #89 #81
संगति 9.0 9.5
सही परीक्षण
प्रति प्रयास पास दर 27.8% 31.5%
अस्थिर टेस्ट 2 1
कुल रन 54 54
प्रति परिणाम लागत 0.165 0.118
कुल लागत $0.007 $0.006
???? ??? $0.250 / 1M $0.150 / 1M
????? ??? $0.750 / 1M $0.600 / 1M
आउटपुट टोकन 1,625 2,207
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 613ms 665ms
प्रतिक्रिया समय (अधिकतम) 1.27s 1.72s
प्रतिक्रिया समय (कुल) 11.04s 11.97s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.0 10.0 0.0% 0 483ms 286 0
Mistral Small 4 3.4 7.9 16.7% 1 395ms 182 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.6 8.9 0.0% 0 969ms 310 0
Mistral Small 4 4.5 9.0 0.0% 0 1.28s 583 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.0 10.0 0.0% 0 606ms 131 0
Mistral Small 4 3.0 10.0 0.0% 0 1.72s 496 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 7.3 5.9 83.3% 1 667ms 180 0
Mistral Small 4 10.0 10.0 100.0% 0 822ms 261 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 5.3 7.2 44.4% 1 534ms 46 0
Mistral Small 4 5.3 10.0 33.3% 0 367ms 28 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 4.8 10.0 0.0% 0 628ms 159 0
Mistral Small 4 4.0 10.0 0.0% 0 729ms 205 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 6.5 10.0 50.0% 0 551ms 82 0
Mistral Small 4 6.5 10.0 50.0% 0 380ms 69 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.1 10.0 0.0% 0 533ms 234 0
Mistral Small 4 3.1 9.9 0.0% 0 589ms 170 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 10.0 10.0 100.0% 0 1.27s 197 0
Mistral Small 4 10.0 10.0 100.0% 0 1.40s 213 0

त्वरित तुलना

तुलना जोड़ी बदलें