नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Mistral: Mistral Small 4 vs StepFun: Step 3.5 Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-17

मेट्रिक Mistral Small 4 Mistral Small 4 none रिलीज़: 2026-03-16 Step 3.5 Flash Step 3.5 Flash medium रिलीज़: 2026-02-01 निःशुल्क उपलब्ध
रैंक #61 #22
स्कोर 5.3 7.9
संगति 9.5 9.1
प्रति परिणाम लागत 0.108 0.000
कुल लागत $0.006 $0.000
सही परीक्षण
प्रति प्रयास पास दर 33.3% 70.6%
अस्थिर टेस्ट 1 2
कुल रन 51 49
आउटपुट टोकन 1,624 71,904
रीजनिंग टोकन 0 155,607
प्रतिक्रिया समय (औसत) 629ms 26.78s
प्रतिक्रिया समय (अधिकतम) 1.72s 170.45s
प्रतिक्रिया समय (कुल) 10.70s 294.58s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.4 7.9 16.7% 1 395ms 182 0
Step 3.5 Flash 10.0 10.0 100.0% 0 13.56s 14,376 17,668
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.0 10.0 0.0% 0 1.72s 496 0
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 10.0 10.0 100.0% 0 822ms 261 0
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 5.3 10.0 33.3% 0 367ms 28 0
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 45,350 90,436
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 4.0 10.0 0.0% 0 729ms 205 0
Step 3.5 Flash 5.5 10.0 0.0% 0 6.54s 2,214 2,584
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 6.5 10.0 50.0% 0 380ms 69 0
Step 3.5 Flash 8.5 6.8 83.3% 1 4.98s 2,284 3,412
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 3.1 9.9 0.0% 0 589ms 170 0
Step 3.5 Flash 5.3 10.0 33.3% 0 7.72s 5,629 10,835
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mistral Small 4 10.0 10.0 100.0% 0 1.40s 213 0
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802

त्वरित तुलना

तुलना जोड़ी बदलें