AI BENCHY
Advertise here
#138

Mistral Small 4

Mistral प्रकाशन: 2026-03-16 चाचणी तारीख: 2026-06-04 13:43 mistralai/mistral-small-2603::medium
(medium) (none)

सारांश

Mistral Small 4 AI BENCHY वर 5.1 स्कोर करते आणि #138 वर आहे. याची reliability 10.0, pass rate 44.4%, एकूण खर्च $0.068, आणि सरासरी response time 9.40s आहे.

Mistral Small 4 खास का आहे: हे अँटी-एआय युक्त्या मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #3 आहे; तर कोडी सोडवणे हा सर्वात कमकुवत भाग आहे, rank #12.

सुसंगतता

6.9

एकूण आउटपुट टोकन्स

108,862

एकूण इनपुट टोकन्स

42,576

इनपुट किंमत

$0.150 / 1M

आउटपुट किंमत

$0.600 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 16

प्रति प्रयत्न पास दर: 44.4%

अस्थिर चाचण्या

8

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

9.40s

प्रतिसाद वेळ (कमाल): 59.15s

प्रतिसाद वेळ (एकूण): 197.39s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#138 Mistral Small 4

medium
Cost
$0.006
Time
47.9s
Tokens
9,857 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 13:43 नवीन चाचणी जोडली 5.3 10.0 $0.068 सध्याची रन
2026-05-22 00:16 सूट बदलला 5.4 10.0 $0.056 तुलना करा
2026-04-11 01:44 पहिली नोंदलेली रन 5.7 लागू नाही $0.034 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 15:40 $0.150 / 1M $0.600 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 5.6 3.8
कोडिंग 4.4 5.1
संयुक्त 3.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 7.3 5.9
डोमेन-विशिष्ट 5.3 7.2
Samanya Buddhimatta 4.8 10.0
सूचनांचे पालन 7.3 5.8
कोडी सोडवणे 3.4 9.7
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स