नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: gpt-oss-120b vs Qwen: Qwen3.5 Plus 2026-04-20

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-26

मेट्रिक gpt-oss-120b gpt-oss-120b none प्रकाशन: 2025-08-05 मोफत उपलब्ध Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 none प्रकाशन: 2026-04-20
स्कोअर 5.4 5.8
क्रमांक #119 #103
विश्वसनीयता 10.0 9.9
सुसंगतता 9.1 8.5
बरोबर चाचण्या
प्रति प्रयत्न पास दर 38.6% 43.3%
अस्थिर चाचण्या 2 4
एकूण रन 57 60
प्रति निकाल खर्च 0.168 0.582
एकूण खर्च $0.011 $0.041
???? ??? $0.000 / 1M $0.300 / 1M
????? ??? $0.000 / 1M $1.800 / 1M
आउटपुट टोकन्स 51,664 11,139
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 21.61s 4.57s
प्रतिसाद वेळ (कमाल) 113.71s 33.34s
प्रतिसाद वेळ (एकूण) 345.79s 91.37s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 6.5 10.0 50.0% 0 32.84s 8,676 0
Qwen3.5 Plus 2026-04-20 4.8 10.0 25.0% 0 1.88s 557 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 4.3 1.1 66.7% 1 9.57s 3,232 0
Qwen3.5 Plus 2026-04-20 4.4 6.7 16.7% 1 2.08s 474 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
Qwen3.5 Plus 2026-04-20 2.8 1.6 33.3% 1 13.32s 2,275 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 6.5 10.0 50.0% 0 7.12s 598 0
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 2.82s 243 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 3.0 10.0 0.0% 0 34.98s 29,483 0
Qwen3.5 Plus 2026-04-20 5.3 10.0 33.3% 0 4.43s 18 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 4.8 10.0 0.0% 0 10.79s 615 0
Qwen3.5 Plus 2026-04-20 4.8 10.0 0.0% 0 1.41s 119 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 9.8 10.0 100.0% 0 5.06s 1,940 0
Qwen3.5 Plus 2026-04-20 6.2 5.8 66.7% 1 1.17s 68 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 6.0 7.2 55.6% 1 8.21s 3,982 0
Qwen3.5 Plus 2026-04-20 6.7 7.9 55.6% 1 1.97s 583 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 4.42s 297 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
gpt-oss-120b 3.0 10.0 0.0% 0 47.29s 3,138 0
Qwen3.5 Plus 2026-04-20 3.0 10.0 0.0% 0 33.34s 6,505 0

झटपट तुलना

तुलना जोडी बदला