नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Mistral: Mistral Small 4 vs OpenAI: gpt-oss-120b

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-17

मेट्रिक Mistral Small 4 Mistral Small 4 none प्रकाशन: 2026-03-16 gpt-oss-120b gpt-oss-120b medium प्रकाशन: 2025-08-05 मोफत उपलब्ध
क्रमांक #61 #46
स्कोअर 5.3 6.0
सुसंगतता 9.5 7.6
प्रति निकाल खर्च 0.108 0.136
एकूण खर्च $0.006 $0.010
बरोबर चाचण्या
प्रति प्रयत्न पास दर 33.3% 51.0%
अस्थिर चाचण्या 1 5
एकूण रन 51 51
आउटपुट टोकन्स 1,624 13,265
रिझनिंग टोकन्स 0 34,330
प्रतिसाद वेळ (सरासरी) 629ms 15.05s
प्रतिसाद वेळ (कमाल) 1.72s 50.92s
प्रतिसाद वेळ (एकूण) 10.70s 150.55s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 3.4 7.9 16.7% 1 395ms 182 0
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 3,518 2,177
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 3.0 10.0 0.0% 0 1.72s 496 0
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 694 5,072
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 10.0 10.0 100.0% 0 822ms 261 0
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 241 1,114
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 5.3 10.0 33.3% 0 367ms 28 0
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 6,784 20,606
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 4.0 10.0 0.0% 0 729ms 205 0
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 107 387
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 6.5 10.0 50.0% 0 380ms 69 0
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 126 1,799
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 3.1 9.9 0.0% 0 589ms 170 0
gpt-oss-120b 3.2 4.7 22.2% 2 11.80s 1,508 2,092
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mistral Small 4 10.0 10.0 100.0% 0 1.40s 213 0
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 287 1,083

झटपट तुलना

तुलना जोडी बदला