नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

OpenAI: gpt-oss-120b vs Qwen: Qwen3.5-9B

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-26

मेट्रिक gpt-oss-120b gpt-oss-120b none रिलीज़: 2025-08-05 निःशुल्क उपलब्ध Qwen3.5-9B Qwen3.5-9B none रिलीज़: 2026-03-02
स्कोर 5.2 4.8
रैंक #98 #105
विश्वसनीयता लागू नहीं लागू नहीं
संगति 7.9 9.6
सही परीक्षण
प्रति प्रयास पास दर 38.9% 24.1%
अस्थिर टेस्ट 5 1
कुल रन 54 54
प्रति परिणाम लागत 0.221 0.116
कुल लागत $0.009 $0.005
???? ??? $0.000 / 1M $0.100 / 1M
????? ??? $0.000 / 1M $0.150 / 1M
आउटपुट टोकन 44,652 3,951
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 11.96s 1.47s
प्रतिक्रिया समय (अधिकतम) 68.97s 5.91s
प्रतिक्रिया समय (कुल) 179.34s 26.43s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 6.6 8.0 58.3% 1 6.03s 4,867 0
Qwen3.5-9B 3.1 9.9 0.0% 0 1.71s 582 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 4.3 1.1 66.7% 1 9.57s 3,232 0
Qwen3.5-9B 5.2 3.4 33.3% 1 5.69s 1,006 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
Qwen3.5-9B 3.0 10.0 0.0% 0 5.91s 1,255 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 6.5 10.0 50.0% 0 7.12s 598 0
Qwen3.5-9B 10.0 10.0 100.0% 0 847ms 249 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 3.0 10.0 0.0% 0 34.98s 29,483 0
Qwen3.5-9B 3.0 10.0 0.0% 0 464ms 24 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 4.6 10.0 0.0% 0 2.83s 586 0
Qwen3.5-9B 4.4 9.9 0.0% 0 552ms 99 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 8.4 6.9 83.3% 1 5.10s 1,982 0
Qwen3.5-9B 6.5 10.0 50.0% 0 514ms 75 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 4.5 4.8 44.5% 2 6.86s 3,904 0
Qwen3.5-9B 3.2 9.9 0.0% 0 683ms 388 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
Qwen3.5-9B 10.0 10.0 100.0% 0 1.27s 273 0

त्वरित तुलना

तुलना जोड़ी बदलें