नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Mistral: Mistral Small 4 vs OpenAI: gpt-oss-120b

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-01

मेट्रिक Mistral Small 4 Mistral Small 4 medium प्रकाशन: 2026-03-16 gpt-oss-120b gpt-oss-120b medium प्रकाशन: 2025-08-05 मोफत उपलब्ध
स्कोअर 5.7 5.8
क्रमांक #99 #91
विश्वसनीयता लागू नाही लागू नाही
सुसंगतता 6.8 7.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 50.0% 51.9%
अस्थिर चाचण्या 7 6
एकूण रन 54 54
प्रति निकाल खर्च 0.674 0.144
एकूण खर्च $0.034 $0.011
???? ??? $0.150 / 1M $0.000 / 1M
????? ??? $0.600 / 1M $0.000 / 1M
आउटपुट टोकन्स 15,084 13,493
रिझनिंग टोकन्स 39,408 36,879
प्रतिसाद वेळ (सरासरी) 5.64s 16.08s
प्रतिसाद वेळ (कमाल) 30.49s 50.92s
प्रतिसाद वेळ (एकूण) 101.52s 176.88s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 5.6 3.8 66.7% 3 2.67s 4,055 4,778
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 3,518 2,177
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 6.7 3.5 66.7% 1 30.49s 2,796 11,296
gpt-oss-120b 4.3 1.1 66.7% 1 26.33s 228 2,549
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 3.0 10.0 0.0% 0 25.25s 2,612 10,700
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 694 5,072
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 7.3 5.9 83.3% 1 1.23s 335 723
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 241 1,114
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 5.3 7.2 44.4% 1 6.11s 2,621 6,904
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 6,784 20,606
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 4.8 10.0 0.0% 0 2.05s 821 828
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 107 387
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 7.3 5.8 83.3% 1 1.38s 540 1,031
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 126 1,799
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 3.4 9.7 0.0% 0 2.00s 983 2,338
gpt-oss-120b 3.2 4.7 22.2% 2 11.80s 1,508 2,092
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 10.0 10.0 100.0% 0 3.50s 321 810
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 287 1,083

झटपट तुलना

तुलना जोडी बदला