#187

Mistral Small 4

Mistral रिलीज़: 2026-03-16 परीक्षण किया गया: 2026-07-16 22:23 mistralai/mistral-small-2603::medium

(medium) (none)

सारांश

Mistral Small 4 AI BENCHY पर 5.1 स्कोर करता है और #187 पर है। इसकी reliability 10.0, pass rate 42.4%, कुल लागत $0.096, और औसत response time 10.77s है।

Mistral Small 4 को अलग क्या बनाता है: यह एंटी-एआई ट्रिक्स में सबसे अलग दिखता है, जहाँ इसकी रैंक #2 है; जबकि डेटा पार्सिंग और निष्कर्षण इसकी सबसे कमजोर जगह है, जहाँ यह #11 पर है।

स्कोर

5.1

संगति

7.0

विश्वसनीयता

10.0

कुल लागत (वर्तमान कीमत)

$0.096

कुल आउटपुट टोकन

131,824

कुल इनपुट टोकन

140,494

इनपुट कीमत

$0.150 / 1M

आउटपुट कीमत

$0.600 / 1M

सही परीक्षण

गलत टेस्ट: 17

प्रति प्रयास पास दर: 42.4%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

10.77s

प्रतिक्रिया समय (अधिकतम): 59.15s

प्रतिक्रिया समय (कुल): 236.94s

गलत उत्तर: 12 API त्रुटि: 2 निर्देशों का पालन नहीं किया: 2 कोई उत्तर नहीं: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#187 Mistral Small 4

medium

लागत: $0.006
समय: 47.9s
टोकन: 9,857 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-07-16 22:23 नया टेस्ट जोड़ा गया	5.1	10.0	$0.096	वर्तमान रन
2026-06-04 13:43 नया टेस्ट जोड़ा गया	5.3	10.0	$0.068	तुलना करें
2026-05-22 00:16 सूट बदला गया	5.4	10.0	$0.056	तुलना करें
2026-04-11 01:44 पहला दर्ज रन	5.7	लागू नहीं	$0.034	तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख	इनपुट कीमत	आउटपुट कीमत
2026-06-04 15:40	$0.150 / 1M	$0.600 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

Mistral Small 4mediumvsQwen3 Coder Nextnone Mistral Small 4mediumvsMiMo-V2.5none Mistral Small 4mediumvsMistral Small 4none Mistral Small 4mediumvsQwen3.5-9Bnone Mistral Small 4mediumvsInklingnone Mistral Small 4mediumvsNorth Mini Codenoneनिःशुल्क उपलब्ध Mistral Small 4mediumvsLing-2.6-1Tnone Mistral Small 4mediumvsMiniMax M2.7medium Mistral Small 4mediumvsQwen3.6 35B A3Bnone Mistral Small 4mediumvsLaguna S 2.1lowनिःशुल्क उपलब्ध

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	5.6	3.8
कोडिंग	4.4	5.1
संयुक्त	3.0	10.0
डेटा पार्सिंग और निष्कर्षण	7.3	5.9
डोमेन-विशिष्ट	5.3	7.2
Samanya Buddhimatta	4.8	10.0
निर्देश पालन	7.3	5.8
पहेली समाधान	3.4	9.7
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

Mistral Small 4

Hamster playing table tennis

#187 Mistral Small 4

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल