नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

OpenAI: GPT-5.5 vs Qwen: Qwen3.6 35B A3B

सारांश

GPT-5.5 vs Qwen3.6 35B A3B benchmark तुलना: Qwen3.6 35B A3B average score में आगे है: 6.7 vs 6.3. Qwen3.6 35B A3B की benchmark लागत कम है: $0.146 vs $0.231. GPT-5.5 तेज है: 1.89s vs 18.08s, pass rates 54.0% vs 63.5%.

अनुशंसित मॉडल: GPT-5.5 - Its score stays close to the best score here (6.3 vs 6.7), while responding about 9.6x faster than Qwen3.6 35B A3B.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक GPT-5.5 GPT-5.5 none रिलीज़: 2026-04-24 Qwen3.6 35B A3B Qwen3.6 35B A3B medium रिलीज़: 2026-04-20
स्कोर 6.3 6.7
रैंक #90 #75
विश्वसनीयता 10.0 10.0
संगति 8.8 9.6
सही परीक्षण
प्रति प्रयास पास दर 54.0% 63.5%
अस्थिर टेस्ट 3 1
कुल रन 63 63
प्रति परिणाम लागत 2.302 1.094
कुल लागत $0.231 $0.146
इनपुट कीमत $5.000 / 1M $0.140 / 1M
आउटपुट कीमत $30.000 / 1M $1.000 / 1M
कुल इनपुट टोकन 34,212 16,385
आउटपुट टोकन 1,971 19,632
रीजनिंग टोकन 0 130,219
प्रतिक्रिया समय (औसत) 1.89s 18.08s
प्रतिक्रिया समय (अधिकतम) 5.56s 86.11s
प्रतिक्रिया समय (कुल) 39.64s 343.61s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#90 GPT-5.5

none
लागत
$0.090
समय
54.3s
टोकन
3,063 tok

#75 Qwen3.6 35B A3B

medium
अमान्य SVG
लागत
$0.000
समय
300.0s
टोकन
0 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 6.9 7.9 66.7% 1 1.31s 606 213 0
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 6.02s 672 1,154 12,385
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 5.5 10.0 33.3% 0 1.35s 7,305 462 0
Qwen3.6 35B A3B 7.7 10.0 66.7% 0 50.55s 5,051 7,929 37,223
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 3.0 10.0 0.0% 0 5.56s 11,019 300 0
Qwen3.6 35B A3B 3.0 10.0 0.0% 0 0ms 0 0 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 1.18s 7,140 222 0
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 12.99s 7,776 2,591 9,968
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 2.9 7.2 11.1% 1 1.31s 723 52 0
Qwen3.6 35B A3B 5.3 7.2 44.4% 1 22.50s 771 6,193 39,116
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 3.41s 477 124 0
Qwen3.6 35B A3B 4.4 9.9 0.0% 0 8.66s 516 129 4,569
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 6.2 5.8 66.7% 1 1.15s 660 81 0
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 7.50s 699 219 7,404
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 7.7 10.0 66.7% 0 1.29s 642 252 0
Qwen3.6 35B A3B 8.0 10.0 66.7% 0 5.95s 696 655 9,228
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 3.90s 5,445 247 0
Qwen3.6 35B A3B 3.0 10.0 0.0% 0 0ms 0 0 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 3.0 10.0 0.0% 0 5.01s 195 18 0
Qwen3.6 35B A3B 3.0 10.0 0.0% 0 32.90s 204 762 10,326

त्वरित तुलना

तुलना जोड़ी बदलें