#79

Mistral Small 4

Mistral प्रकाशन: 2026-03-16 चाचणी तारीख: 2026-04-11 01:44 mistralai/mistral-small-2603::medium

(medium) (none)

सारांश

Mistral Small 4 AI BENCHY वर 5.7 स्कोर करते आणि #79 वर आहे. याची reliability लागू नाही, pass rate 50.0%, एकूण खर्च $0.034, आणि सरासरी response time 5.64s आहे.

Mistral Small 4 खास का आहे: हे कोडिंग मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #3 आहे; तर संयुक्त हा सर्वात कमकुवत भाग आहे, rank #18. या score range साठी एकूण benchmark खर्च असामान्यपणे कमी आहे.

स्कोअर

5.7

सुसंगतता

6.8

विश्वसनीयता

लागू नाही

एकूण खर्च (सध्याची किंमत)

$0.034

एकूण आउटपुट टोकन्स

54,492

एकूण इनपुट टोकन्स

इनपुट किंमत

$0.150 / 1M

आउटपुट किंमत

$0.600 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 13

प्रति प्रयत्न पास दर: 50.0%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

5.64s

प्रतिसाद वेळ (कमाल): 30.49s

प्रतिसाद वेळ (एकूण): 101.52s

चुकीचे उत्तर: 8 सूचनांचे पालन केले नाही: 3 API त्रुटी: 2

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#79 Mistral Small 4

medium

खर्च: $0.006
वेळ: 47.9s
टोकन्स: 9,857 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-07-16 22:23 नवीन चाचणी जोडली	5.1	10.0	$0.096	तुलना करा
2026-06-04 13:43 नवीन चाचणी जोडली	5.3	10.0	$0.068	तुलना करा
2026-05-22 00:16 सूट बदलला	5.4	10.0	$0.056	तुलना करा
2026-04-11 01:44 पहिली नोंदलेली रन	5.7	लागू नाही	$0.034	सध्याची रन

रन तुलना

रन	स्कोअर	सुसंगतता	विश्वसनीयता	बरोबर चाचण्या	अस्थिर चाचण्या	एकूण आउटपुट टोकन्स	एकूण इनपुट टोकन्स	एकूण खर्च	प्रतिसाद वेळ (सरासरी)
2026-04-11 01:44 · पहिली नोंदलेली रन	5.7	6.8	लागू नाही	5/18	7	54,492	0	$0.034	5.64s
2026-06-04 13:43 · नवीन चाचणी जोडली	5.3	6.9	10.0	5/21	8	108,862	42,576	$0.068	9.40s
फरक	+0.4	-0.1		0	-1	-54370	-42576	-$0.034	-3760ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

Mistral Small 4mediumvsQwen3 Coder Nextnone Mistral Small 4mediumvsMiMo-V2.5none Mistral Small 4mediumvsMistral Small 4none Mistral Small 4mediumvsQwen3.5-9Bnone Mistral Small 4mediumvsInklingnone Mistral Small 4mediumvsNorth Mini Codenoneमोफत उपलब्ध Mistral Small 4mediumvsLing-2.6-1Tnone Mistral Small 4mediumvsMiniMax M2.7medium Mistral Small 4mediumvsQwen3.6 35B A3Bnone Mistral Small 4mediumvsLaguna S 2.1lowमोफत उपलब्ध

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	5.6	3.8
कोडिंग	6.7	3.5
संयुक्त	3.0	10.0
डेटा पार्सिंग आणि निष्कर्षण	7.3	5.9
डोमेन-विशिष्ट	5.3	7.2
Samanya Buddhimatta	4.8	10.0
सूचनांचे पालन	7.3	5.8
कोडी सोडवणे	3.4	9.7
टूल कॉलिंग	10.0	10.0

Mistral Small 4

Hamster playing table tennis

#79 Mistral Small 4

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स