नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

Mistral: Mistral Small 4 vs xAI: Grok 4.20 Beta

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-17

मेट्रिक Mistral Small 4 Mistral Small 4 none प्रकाशन: 2026-03-16 Grok 4.20 Beta Grok 4.20 Beta none प्रकाशन: 2026-03-12
क्रमांक #61 #58
स्कोअर 5.3 5.3
सुसंगतता 9.5 9.1
प्रति निकाल खर्च 0.108 2.240
एकूण खर्च $0.006 $0.090
बरोबर चाचण्या
प्रति प्रयत्न पास दर 33.3% 31.4%
अस्थिर चाचण्या 1 2
एकूण रन 51 51
आउटपुट टोकन्स 1,624 1,517
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 629ms 1.19s
प्रतिसाद वेळ (कमाल) 1.72s 6.48s
प्रतिसाद वेळ (एकूण) 10.70s 20.22s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 3.4 7.9 16.7% 1 395ms 182 0
Grok 4.20 Beta 4.0 8.4 16.7% 1 597ms 251 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 3.0 10.0 0.0% 0 1.72s 496 0
Grok 4.20 Beta 3.0 10.0 0.0% 0 6.48s 282 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 10.0 10.0 100.0% 0 822ms 261 0
Grok 4.20 Beta 10.0 10.0 100.0% 0 601ms 197 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 5.3 10.0 33.3% 0 367ms 28 0
Grok 4.20 Beta 3.0 10.0 0.0% 0 611ms 160 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 4.0 10.0 0.0% 0 729ms 205 0
Grok 4.20 Beta 5.0 10.0 0.0% 0 541ms 87 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 6.5 10.0 50.0% 0 380ms 69 0
Grok 4.20 Beta 4.8 10.0 0.0% 0 687ms 60 0
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 3.1 9.9 0.0% 0 589ms 170 0
Grok 4.20 Beta 5.9 7.2 55.6% 1 541ms 291 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 10.0 10.0 100.0% 0 1.40s 213 0
Grok 4.20 Beta 10.0 10.0 100.0% 0 4.79s 189 0

झटपट तुलना

तुलना जोडी बदला