नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-4o-mini vs OpenAI: gpt-oss-120b

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-29

मेट्रिक GPT-4o-mini GPT-4o-mini none प्रकाशन: 2024-07-18 gpt-oss-120b gpt-oss-120b none प्रकाशन: 2025-08-05 मोफत उपलब्ध
स्कोअर 4.9 5.2
क्रमांक #119 #110
विश्वसनीयता लागू नाही लागू नाही
सुसंगतता 9.9 7.9
बरोबर चाचण्या
प्रति प्रयत्न पास दर 22.2% 38.9%
अस्थिर चाचण्या 0 5
एकूण रन 54 54
प्रति निकाल खर्च 0.122 0.221
एकूण खर्च $0.005 $0.009
???? ??? $0.150 / 1M $0.000 / 1M
????? ??? $0.600 / 1M $0.000 / 1M
आउटपुट टोकन्स 1,947 44,652
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 2.00s 11.96s
प्रतिसाद वेळ (कमाल) 7.58s 68.97s
प्रतिसाद वेळ (एकूण) 21.99s 179.34s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-4o-mini 4.8 10.0 25.0% 0 1.34s 186 0
gpt-oss-120b 6.6 8.0 58.3% 1 6.03s 4,867 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-4o-mini 3.0 8.7 0.0% 0 2.55s 347 0
gpt-oss-120b 4.3 1.1 66.7% 1 9.57s 3,232 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-4o-mini 3.0 10.0 0.0% 0 7.58s 568 0
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-4o-mini 10.0 10.0 100.0% 0 1.27s 183 0
gpt-oss-120b 6.5 10.0 50.0% 0 7.12s 598 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-4o-mini 3.0 10.0 0.0% 0 637ms 15 0
gpt-oss-120b 3.0 10.0 0.0% 0 34.98s 29,483 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-4o-mini 4.0 10.0 0.0% 0 909ms 66 0
gpt-oss-120b 4.6 10.0 0.0% 0 2.83s 586 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-4o-mini 4.8 10.0 0.0% 0 1.27s 69 0
gpt-oss-120b 8.4 6.9 83.3% 1 5.10s 1,982 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-4o-mini 3.7 10.0 0.0% 0 1.30s 308 0
gpt-oss-120b 4.5 4.8 44.5% 2 6.86s 3,904 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
GPT-4o-mini 10.0 10.0 100.0% 0 2.51s 205 0
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0

झटपट तुलना

तुलना जोडी बदला