नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

OpenAI: GPT-5.5 vs Qwen: Qwen3.6 Max Preview

सारांश

GPT-5.5 vs Qwen3.6 Max Preview benchmark तुलना: GPT-5.5 average score में आगे है: 8.8 vs 8.5. Qwen3.6 Max Preview की benchmark लागत कम है: $0.960 vs $3.679. GPT-5.5 तेज है: 37.98s vs 59.63s, pass rates 87.3% vs 81.0%.

अनुशंसित मॉडल: Qwen3.6 Max Preview - Its score stays close to the best score here (8.5 vs 8.8), while costing about 3.8x less than GPT-5.5.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-10

मेट्रिक GPT-5.5 GPT-5.5 medium रिलीज़: 2026-04-24 Qwen3.6 Max Preview Qwen3.6 Max Preview medium रिलीज़: 2026-04-20
स्कोर 8.8 8.5
रैंक #9 #15
विश्वसनीयता 10.0 10.0
संगति 8.9 9.3
सही परीक्षण
प्रति प्रयास पास दर 87.3% 81.0%
अस्थिर टेस्ट 3 2
कुल रन 63 63
प्रति परिणाम लागत 21.638 7.024
कुल लागत $3.679 $0.960
इनपुट कीमत $5.000 / 1M $1.040 / 1M
आउटपुट कीमत $30.000 / 1M $6.240 / 1M
कुल इनपुट टोकन 34,212 42,362
आउटपुट टोकन 1,985 2,273
रीजनिंग टोकन 114,925 144,367
प्रतिक्रिया समय (औसत) 37.98s 59.63s
प्रतिक्रिया समय (अधिकतम) 332.10s 238.07s
प्रतिक्रिया समय (कुल) 797.60s 1252.17s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#9 GPT-5.5

medium
Cost
$0.112
Time
71.9s
Tokens
3,807 tok

#15 Qwen3.6 Max Preview

medium
Cost
$0.024
Time
76.5s
Tokens
3,861 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 4.66s 606 250 1,335
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 22.13s 672 228 10,075
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 8.8 7.8 88.9% 1 59.77s 7,305 362 24,959
Qwen3.6 Max Preview 8.8 7.8 88.9% 1 146.48s 7,895 427 52,957
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 19.29s 11,019 312 2,841
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 121.49s 14,934 390 14,575
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 4.18s 7,140 234 593
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 41.15s 7,782 270 10,106
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 5.3 7.2 44.4% 1 164.14s 723 67 79,625
Qwen3.6 Max Preview 2.9 7.2 11.1% 1 95.91s 771 60 30,371
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 4.16s 477 138 223
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 32.24s 516 129 3,510
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 3.36s 660 93 538
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 24.31s 699 103 5,848
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 6.76s 642 241 2,225
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 24.32s 696 329 7,693
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 10.57s 5,445 258 832
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 18.32s 8,193 309 1,571
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 2.8 1.6 33.3% 1 37.86s 195 30 1,754
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 60.56s 204 28 7,661

त्वरित तुलना

तुलना जोड़ी बदलें