नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-5.5 vs Qwen: Qwen3.5-35B-A3B

सारांश

GPT-5.5 vs Qwen3.5-35B-A3B benchmark तुलना: average score लगभग बराबर है: 6.3 vs 6.3. GPT-5.5 की benchmark लागत कम है: $0.231 vs $0.401. GPT-5.5 तेज है: 1.89s vs 72.57s, pass rates 54.0% vs 69.8%.

अनुशंसित मॉडल: GPT-5.5 - It has the best score here (6.3), while costing about 1.7x less than Qwen3.5-35B-A3B.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-12

मेट्रिक GPT-5.5 GPT-5.5 none रिलीज़: 2026-04-24 Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium रिलीज़: 2026-02-24
स्कोर 6.3 6.3
रैंक #89 #88
विश्वसनीयता 10.0 10.0
संगति 8.8 7.5
सही परीक्षण
प्रति प्रयास पास दर 54.0% 69.8%
अस्थिर टेस्ट 3 6
कुल रन 63 63
प्रति परिणाम लागत 2.302 5.162
कुल लागत $0.231 $0.401
इनपुट कीमत $5.000 / 1M $0.140 / 1M
आउटपुट कीमत $30.000 / 1M $1.000 / 1M
कुल इनपुट टोकन 34,212 42,196
आउटपुट टोकन 1,971 40,630
रीजनिंग टोकन 0 353,577
प्रतिक्रिया समय (औसत) 1.89s 72.57s
प्रतिक्रिया समय (अधिकतम) 5.56s 409.98s
प्रतिक्रिया समय (कुल) 39.64s 1524.04s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#89 GPT-5.5

none
Cost
$0.090
Time
54.3s
Tokens
3,063 tok

#88 Qwen3.5-35B-A3B

medium
Cost
$0.009
Time
71.4s
Tokens
8,631 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 6.9 7.9 66.7% 1 1.31s 606 213 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 21.13s 672 798 42,652
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 5.5 10.0 33.3% 0 1.35s 7,305 462 0
Qwen3.5-35B-A3B 5.9 9.3 33.3% 0 206.65s 4,106 23,844 111,462
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 3.0 10.0 0.0% 0 5.56s 11,019 300 0
Qwen3.5-35B-A3B 4.7 1.6 66.7% 1 75.34s 20,992 775 12,485
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 1.18s 7,140 222 0
Qwen3.5-35B-A3B 7.3 5.9 83.3% 1 59.33s 6,061 235 19,493
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 2.9 7.2 11.1% 1 1.31s 723 52 0
Qwen3.5-35B-A3B 4.1 4.4 44.5% 2 88.34s 500 41 46,368
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 3.41s 477 124 0
Qwen3.5-35B-A3B 2.8 1.6 33.3% 1 30.30s 172 20 3,753
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 6.2 5.8 66.7% 1 1.15s 660 81 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 24.45s 699 97 17,361
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 7.7 10.0 66.7% 0 1.29s 642 252 0
Qwen3.5-35B-A3B 8.2 7.2 88.9% 1 33.13s 597 3,592 26,585
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 3.90s 5,445 247 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 4.65s 8,193 309 1,365
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 3.0 10.0 0.0% 0 5.01s 195 18 0
Qwen3.5-35B-A3B 3.0 10.0 0.0% 0 177.35s 204 10,919 72,053

त्वरित तुलना

तुलना जोड़ी बदलें