नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: gpt-oss-120b vs Qwen: Qwen3.5-9B

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-26

मेट्रिक gpt-oss-120b gpt-oss-120b none प्रकाशन: 2025-08-05 मोफत उपलब्ध Qwen3.5-9B Qwen3.5-9B none प्रकाशन: 2026-03-02
स्कोअर 5.2 4.8
क्रमांक #98 #105
विश्वसनीयता लागू नाही लागू नाही
सुसंगतता 7.9 9.6
बरोबर चाचण्या
प्रति प्रयत्न पास दर 38.9% 24.1%
अस्थिर चाचण्या 5 1
एकूण रन 54 54
प्रति निकाल खर्च 0.221 0.116
एकूण खर्च $0.009 $0.005
???? ??? $0.000 / 1M $0.100 / 1M
????? ??? $0.000 / 1M $0.150 / 1M
आउटपुट टोकन्स 44,652 3,951
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 11.96s 1.47s
प्रतिसाद वेळ (कमाल) 68.97s 5.91s
प्रतिसाद वेळ (एकूण) 179.34s 26.43s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 6.6 8.0 58.3% 1 6.03s 4,867 0
Qwen3.5-9B 3.1 9.9 0.0% 0 1.71s 582 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 4.3 1.1 66.7% 1 9.57s 3,232 0
Qwen3.5-9B 5.2 3.4 33.3% 1 5.69s 1,006 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
Qwen3.5-9B 3.0 10.0 0.0% 0 5.91s 1,255 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 6.5 10.0 50.0% 0 7.12s 598 0
Qwen3.5-9B 10.0 10.0 100.0% 0 847ms 249 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 3.0 10.0 0.0% 0 34.98s 29,483 0
Qwen3.5-9B 3.0 10.0 0.0% 0 464ms 24 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 4.6 10.0 0.0% 0 2.83s 586 0
Qwen3.5-9B 4.4 9.9 0.0% 0 552ms 99 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 8.4 6.9 83.3% 1 5.10s 1,982 0
Qwen3.5-9B 6.5 10.0 50.0% 0 514ms 75 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 4.5 4.8 44.5% 2 6.86s 3,904 0
Qwen3.5-9B 3.2 9.9 0.0% 0 683ms 388 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
Qwen3.5-9B 10.0 10.0 100.0% 0 1.27s 273 0

झटपट तुलना

तुलना जोडी बदला