नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Mistral: Mistral Small 4 vs Hunter Alpha

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-17

मेट्रिक Mistral Small 4 Mistral Small 4 medium रिलीज़: 2026-03-16 Hunter Alpha Hunter Alpha none रिलीज़: रिलीज़ तिथि अज्ञात
रैंक #55 #51
स्कोर 5.6 5.9
संगति 7.0 8.1
प्रति परिणाम लागत 0.502 0.000
कुल लागत $0.026 $0.000
सही परीक्षण
प्रति प्रयास पास दर 49.0% 49.0%
अस्थिर टेस्ट 6 4
कुल रन 51 51
आउटपुट टोकन 12,288 2,278
रीजनिंग टोकन 28,112 0
प्रतिक्रिया समय (औसत) 4.18s 4.58s
प्रतिक्रिया समय (अधिकतम) 25.25s 15.17s
प्रतिक्रिया समय (कुल) 71.03s 77.92s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 5.6 3.8 66.7% 3 2.67s 4,055 4,778
Hunter Alpha 3.5 8.0 16.7% 1 3.81s 779 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.0 10.0 0.0% 0 25.25s 2,612 10,700
Hunter Alpha 3.0 10.0 0.0% 0 15.17s 379 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 7.3 5.9 83.3% 1 1.23s 335 723
Hunter Alpha 10.0 10.0 100.0% 0 8.49s 249 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 5.3 7.2 44.4% 1 6.11s 2,621 6,904
Hunter Alpha 5.3 10.0 33.3% 0 2.33s 27 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 4.8 10.0 0.0% 0 2.05s 821 828
Hunter Alpha 6.1 3.1 66.7% 1 2.71s 91 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 7.3 5.8 83.3% 1 1.38s 540 1,031
Hunter Alpha 6.4 10.0 50.0% 0 2.82s 69 0
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.4 9.7 0.0% 0 2.00s 983 2,338
Hunter Alpha 5.8 4.4 66.7% 2 3.06s 349 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 10.0 10.0 100.0% 0 3.50s 321 810
Hunter Alpha 10.0 10.0 100.0% 0 6.02s 335 0

त्वरित तुलना

तुलना जोड़ी बदलें