#79

Mistral Small 4

Mistral रिलीज़: 2026-03-16 परीक्षण किया गया: 2026-04-11 01:44 mistralai/mistral-small-2603::medium

(medium) (none)

सारांश

Mistral Small 4 AI BENCHY पर 5.7 स्कोर करता है और #79 पर है। इसकी reliability लागू नहीं, pass rate 50.0%, कुल लागत $0.034, और औसत response time 5.64s है।

Mistral Small 4 को अलग क्या बनाता है: यह कोडिंग में सबसे अलग दिखता है, जहाँ इसकी रैंक #3 है; जबकि संयुक्त इसकी सबसे कमजोर जगह है, जहाँ यह #18 पर है। इस score range के लिए इसकी कुल benchmark लागत असामान्य रूप से कम है।

स्कोर

5.7

संगति

6.8

विश्वसनीयता

लागू नहीं

कुल लागत (वर्तमान कीमत)

$0.034

कुल आउटपुट टोकन

54,492

कुल इनपुट टोकन

इनपुट कीमत

$0.150 / 1M

आउटपुट कीमत

$0.600 / 1M

सही परीक्षण

गलत टेस्ट: 13

प्रति प्रयास पास दर: 50.0%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

5.64s

प्रतिक्रिया समय (अधिकतम): 30.49s

प्रतिक्रिया समय (कुल): 101.52s

गलत उत्तर: 8 निर्देशों का पालन नहीं किया: 3 API त्रुटि: 2

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#79 Mistral Small 4

medium

लागत: $0.006
समय: 47.9s
टोकन: 9,857 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-07-16 22:23 नया टेस्ट जोड़ा गया	5.1	10.0	$0.096	तुलना करें
2026-06-04 13:43 नया टेस्ट जोड़ा गया	5.3	10.0	$0.068	तुलना करें
2026-05-22 00:16 सूट बदला गया	5.4	10.0	$0.056	तुलना करें
2026-04-11 01:44 पहला दर्ज रन	5.7	लागू नहीं	$0.034	वर्तमान रन

रन तुलना

रन	स्कोर	संगति	विश्वसनीयता	सही परीक्षण	अस्थिर टेस्ट	कुल आउटपुट टोकन	कुल लागत	प्रतिक्रिया समय (औसत)
2026-04-11 01:44 · पहला दर्ज रन	5.7	6.8	लागू नहीं	5/18	7	54,492	$0.034	5.64s
2026-05-22 00:16 · सूट बदला गया	5.4	7.1	10.0	5/20	7	89,683	$0.056	8.33s
अंतर	+0.3	-0.3		0	0	-35191	-$0.022	-2689ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

Mistral Small 4mediumvsQwen3 Coder Nextnone Mistral Small 4mediumvsMiMo-V2.5none Mistral Small 4mediumvsMistral Small 4none Mistral Small 4mediumvsQwen3.5-9Bnone Mistral Small 4mediumvsInklingnone Mistral Small 4mediumvsNorth Mini Codenoneनिःशुल्क उपलब्ध Mistral Small 4mediumvsLing-2.6-1Tnone Mistral Small 4mediumvsMiniMax M2.7medium Mistral Small 4mediumvsQwen3.6 35B A3Bnone Mistral Small 4mediumvsLaguna S 2.1lowनिःशुल्क उपलब्ध

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	5.6	3.8
कोडिंग	6.7	3.5
संयुक्त	3.0	10.0
डेटा पार्सिंग और निष्कर्षण	7.3	5.9
डोमेन-विशिष्ट	5.3	7.2
Samanya Buddhimatta	4.8	10.0
निर्देश पालन	7.3	5.8
पहेली समाधान	3.4	9.7
टूल कॉलिंग	10.0	10.0

Mistral Small 4

Hamster playing table tennis

#79 Mistral Small 4

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल