नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Inception: Mercury 2 vs Mistral: Mistral Small 4

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-17

मेट्रिक Mercury 2 Mercury 2 medium रिलीज़: 2026-02-24 Mistral Small 4 Mistral Small 4 none रिलीज़: 2026-03-16
रैंक #42 #61
स्कोर 6.3 5.3
संगति 8.5 9.5
प्रति परिणाम लागत 0.634 0.108
कुल लागत $0.045 $0.006
सही परीक्षण
प्रति प्रयास पास दर 51.0% 33.3%
अस्थिर टेस्ट 3 1
कुल रन 51 51
आउटपुट टोकन 3,723 1,624
रीजनिंग टोकन 46,120 0
प्रतिक्रिया समय (औसत) 2.25s 629ms
प्रतिक्रिया समय (अधिकतम) 14.63s 1.72s
प्रतिक्रिया समय (कुल) 35.99s 10.70s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 6.9 9.9 50.0% 0 1.12s 2,546 2,609
Mistral Small 4 3.4 7.9 16.7% 1 395ms 182 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 10.0 10.0 100.0% 0 3.28s 268 4,887
Mistral Small 4 3.0 10.0 0.0% 0 1.72s 496 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 7.3 5.9 83.3% 1 1.11s 183 1,656
Mistral Small 4 10.0 10.0 100.0% 0 822ms 261 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 2.9 7.2 11.1% 1 6.48s 41 30,754
Mistral Small 4 5.3 10.0 33.3% 0 367ms 28 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 4.8 10.0 0.0% 0 821ms 137 542
Mistral Small 4 4.0 10.0 0.0% 0 729ms 205 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 10.0 10.0 100.0% 0 1.07s 14 958
Mistral Small 4 6.5 10.0 50.0% 0 380ms 69 0
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.9 7.5 22.2% 1 934ms 354 2,758
Mistral Small 4 3.1 9.9 0.0% 0 589ms 170 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 10.0 10.0 100.0% 0 1.89s 180 1,956
Mistral Small 4 10.0 10.0 100.0% 0 1.40s 213 0

त्वरित तुलना

तुलना जोड़ी बदलें