नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

Mistral: Mistral Small 4 vs Nemotron 3 Super 120b A12b

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-17

मेट्रिक Mistral Small 4 Mistral Small 4 medium प्रकाशन: 2026-03-16 Nemotron 3 Super 120b A12b Nemotron 3 Super 120b A12b none प्रकाशन: 2026-03-11 मोफत उपलब्ध
क्रमांक #55 #62
स्कोअर 5.6 5.2
सुसंगतता 7.0 8.6
प्रति निकाल खर्च 0.502 0.000
एकूण खर्च $0.026 $0.000
बरोबर चाचण्या
प्रति प्रयत्न पास दर 49.0% 35.3%
अस्थिर चाचण्या 6 3
एकूण रन 51 49
आउटपुट टोकन्स 12,288 4,225
रिझनिंग टोकन्स 28,112 0
प्रतिसाद वेळ (सरासरी) 4.18s 8.86s
प्रतिसाद वेळ (कमाल) 25.25s 24.97s
प्रतिसाद वेळ (एकूण) 71.03s 150.70s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 5.6 3.8 66.7% 3 2.67s 4,055 4,778
Nemotron 3 Super 120b A12b 4.8 10.0 25.0% 0 7.43s 2,174 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 3.0 10.0 0.0% 0 25.25s 2,612 10,700
Nemotron 3 Super 120b A12b 3.0 10.0 0.0% 0 19.98s 124 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 7.3 5.9 83.3% 1 1.23s 335 723
Nemotron 3 Super 120b A12b 10.0 10.0 100.0% 0 7.92s 249 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 5.3 7.2 44.4% 1 6.11s 2,621 6,904
Nemotron 3 Super 120b A12b 3.6 7.2 22.2% 1 6.23s 26 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 4.8 10.0 0.0% 0 2.05s 821 828
Nemotron 3 Super 120b A12b 4.2 9.9 0.0% 0 24.97s 170 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 7.3 5.8 83.3% 1 1.38s 540 1,031
Nemotron 3 Super 120b A12b 4.9 6.9 33.3% 1 1.50s 66 0
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 3.4 9.7 0.0% 0 2.00s 983 2,338
Nemotron 3 Super 120b A12b 5.7 10.0 33.3% 0 7.50s 1,135 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 10.0 10.0 100.0% 0 3.50s 321 810
Nemotron 3 Super 120b A12b 4.7 1.6 66.7% 1 16.00s 281 0

झटपट तुलना

तुलना जोडी बदला