नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

Trinity Large Preview vs OpenAI: gpt-oss-120b

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-11

मेट्रिक Trinity Large Preview Trinity Large Preview none प्रकाशन: 2026-01-27 मोफत उपलब्ध gpt-oss-120b gpt-oss-120b none प्रकाशन: 2025-08-05 मोफत उपलब्ध
स्कोअर 5.3 5.2
क्रमांक #74 #79
सुसंगतता 9.6 7.9
बरोबर चाचण्या
प्रति प्रयत्न पास दर 29.6% 38.9%
अस्थिर चाचण्या 1 5
एकूण रन 52 54
प्रति निकाल खर्च 0.000 0.221
एकूण खर्च $0.000 $0.009
???? ??? $0.000 / 1M $0.039 / 1M
????? ??? $0.000 / 1M $0.190 / 1M
आउटपुट टोकन्स 1,985 44,652
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 5.07s 11.96s
प्रतिसाद वेळ (कमाल) 39.47s 68.97s
प्रतिसाद वेळ (एकूण) 91.23s 179.34s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 3.0 10.0 0.0% 0 3.02s 593 0
gpt-oss-120b 6.6 8.0 58.3% 1 6.03s 4,867 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 6.3 10.0 0.0% 0 39.47s 142 0
gpt-oss-120b 4.3 1.1 66.7% 1 9.57s 3,232 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 3.0 10.0 0.0% 0 8.91s 294 0
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 10.0 10.0 100.0% 0 3.26s 186 0
gpt-oss-120b 6.5 10.0 50.0% 0 7.12s 598 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 5.3 10.0 33.3% 0 877ms 25 0
gpt-oss-120b 3.0 10.0 0.0% 0 34.98s 29,483 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 4.4 9.9 0.0% 0 2.86s 124 0
gpt-oss-120b 4.6 10.0 0.0% 0 2.83s 586 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 4.1 6.7 16.7% 1 1.09s 63 0
gpt-oss-120b 8.4 6.9 83.3% 1 5.10s 1,982 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 5.4 10.0 33.3% 0 3.30s 291 0
gpt-oss-120b 4.5 4.8 44.5% 2 6.86s 3,904 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 267 0
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0

झटपट तुलना

तुलना जोडी बदला