नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: gpt-oss-120b vs Elephant

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-14

मेट्रिक gpt-oss-120b gpt-oss-120b medium प्रकाशन: 2025-08-05 मोफत उपलब्ध Elephant Elephant none प्रकाशन: 2026-04-14
स्कोअर 5.8 5.2
क्रमांक #65 #81
सुसंगतता 7.2 9.6
बरोबर चाचण्या
प्रति प्रयत्न पास दर 51.9% 31.5%
अस्थिर चाचण्या 6 1
एकूण रन 54 54
प्रति निकाल खर्च 0.144 0.000
एकूण खर्च $0.011 $0.000
???? ??? $0.039 / 1M $0.000 / 1M
????? ??? $0.190 / 1M $0.000 / 1M
आउटपुट टोकन्स 13,493 2,573
रिझनिंग टोकन्स 36,879 0
प्रतिसाद वेळ (सरासरी) 16.08s 1.23s
प्रतिसाद वेळ (कमाल) 50.92s 3.81s
प्रतिसाद वेळ (एकूण) 176.88s 22.16s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 3,518 2,177
Elephant 6.6 10.0 50.0% 0 963ms 610 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 4.3 1.1 66.7% 1 26.33s 228 2,549
Elephant 6.4 3.3 66.7% 1 1.39s 375 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 694 5,072
Elephant 3.0 10.0 0.0% 0 3.81s 731 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 241 1,114
Elephant 6.5 10.0 50.0% 0 1.04s 246 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 6,784 20,606
Elephant 3.0 10.0 0.0% 0 927ms 24 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 107 387
Elephant 4.0 10.0 0.0% 0 854ms 106 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 126 1,799
Elephant 9.8 10.0 100.0% 0 1.03s 81 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 3.2 4.7 22.2% 2 11.80s 1,508 2,092
Elephant 3.3 10.0 0.0% 0 849ms 170 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 287 1,083
Elephant 3.0 10.0 0.0% 0 2.79s 230 0

झटपट तुलना

तुलना जोडी बदला