नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

OpenAI: gpt-oss-120b vs Qwen: Qwen3.6 35B A3B

सारांश

gpt-oss-120b vs Qwen3.6 35B A3B benchmark तुलना: gpt-oss-120b average score में आगे है: 5.4 vs 4.6. gpt-oss-120b की benchmark लागत कम है: $0.010 vs $0.031. Qwen3.6 35B A3B तेज है: 3.73s vs 21.61s, pass rates 38.6% vs 30.2%.

अनुशंसित मॉडल: gpt-oss-120b - It has the best score here (5.4), while costing about 3.2x less than Qwen3.6 35B A3B.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-10

मेट्रिक gpt-oss-120b gpt-oss-120b none रिलीज़: 2025-08-05 निःशुल्क उपलब्ध Qwen3.6 35B A3B Qwen3.6 35B A3B none रिलीज़: 2026-04-20
स्कोर 5.4 4.6
रैंक #127 #154
विश्वसनीयता 10.0 10.0
संगति 9.1 8.0
सही परीक्षण
प्रति प्रयास पास दर 38.6% 30.2%
अस्थिर टेस्ट 2 5
कुल रन 57 63
प्रति परिणाम लागत 0.168 0.754
कुल लागत $0.010 $0.031
इनपुट कीमत $0.039 / 1M $0.140 / 1M
आउटपुट कीमत $0.180 / 1M $1.000 / 1M
कुल इनपुट टोकन 9,081 19,329
आउटपुट टोकन 51,664 27,755
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 21.61s 3.73s
प्रतिक्रिया समय (अधिकतम) 113.71s 22.52s
प्रतिक्रिया समय (कुल) 345.79s 70.86s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#127 gpt-oss-120b

none
No showcase result has been generated for this model yet.
Cost
$0.000
Time
-
Tokens
0 tok

#154 Qwen3.6 35B A3B

none
Cost
$0.008
Time
30.1s
Tokens
6,317 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 6.5 10.0 50.0% 0 32.84s 1,336 8,676 0
Qwen3.6 35B A3B 3.6 7.6 16.7% 1 2.10s 696 1,571 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 4.3 1.1 66.7% 1 9.57s 901 3,232 0
Qwen3.6 35B A3B 5.5 10.0 33.3% 0 8.77s 7,911 11,161 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0 0
Qwen3.6 35B A3B 3.0 10.0 0.0% 0 0ms 0 0 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 6.5 10.0 50.0% 0 7.12s 2,421 598 0
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 1.46s 7,788 248 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 3.0 10.0 0.0% 0 34.98s 1,294 29,483 0
Qwen3.6 35B A3B 3.5 4.4 33.3% 2 7.45s 781 11,381 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 4.8 10.0 0.0% 0 10.79s 584 615 0
Qwen3.6 35B A3B 4.4 3.0 33.3% 1 3.51s 520 1,545 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 9.8 10.0 100.0% 0 5.06s 1,043 1,940 0
Qwen3.6 35B A3B 6.2 5.8 66.7% 1 1.86s 709 1,264 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 6.0 7.2 55.6% 1 8.21s 1,188 3,982 0
Qwen3.6 35B A3B 3.2 9.9 0.0% 0 1.07s 714 573 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0 0
Qwen3.6 35B A3B 3.0 10.0 0.0% 0 0ms 0 0 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 3.0 10.0 0.0% 0 47.29s 314 3,138 0
Qwen3.6 35B A3B 3.0 10.0 0.0% 0 414ms 210 12 0

त्वरित तुलना

तुलना जोड़ी बदलें