नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

OpenAI: GPT-5.5 vs Qwen: Qwen3.6 Max Preview

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-27

मेट्रिक GPT-5.5 GPT-5.5 medium रिलीज़: 2026-04-24 Qwen3.6 Max Preview Qwen3.6 Max Preview none रिलीज़: 2026-04-20
स्कोर 9.0 7.3
रैंक #6 #56
विश्वसनीयता लागू नहीं 10.0
संगति 9.2 8.7
सही परीक्षण
प्रति प्रयास पास दर 87.0% 66.7%
अस्थिर टेस्ट 2 3
कुल रन 54 54
प्रति परिणाम लागत 19.226 0.827
कुल लागत $2.884 $0.083
???? ??? $5.000 / 1M $1.300 / 1M
????? ??? $30.000 / 1M $7.800 / 1M
आउटपुट टोकन 1,920 4,732
रीजनिंग टोकन 89,632 0
प्रतिक्रिया समय (औसत) 32.75s 3.38s
प्रतिक्रिया समय (अधिकतम) 332.10s 20.51s
प्रतिक्रिया समय (कुल) 589.59s 60.83s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 4.66s 250 1,335
Qwen3.6 Max Preview 5.2 7.9 41.7% 1 2.63s 513 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 9.09s 318 1,391
Qwen3.6 Max Preview 5.0 2.0 66.7% 1 3.45s 426 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 19.29s 312 2,841
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 20.51s 2,842 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 4.18s 234 593
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.87s 243 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 5.3 7.2 44.4% 1 164.14s 67 79,625
Qwen3.6 Max Preview 7.7 10.0 66.7% 0 1.22s 18 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 4.16s 138 223
Qwen3.6 Max Preview 4.3 10.0 0.0% 0 1.62s 76 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 3.36s 93 538
Qwen3.6 Max Preview 8.4 6.9 83.3% 1 1.45s 69 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 8.6 7.9 77.8% 1 6.78s 250 2,254
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.38s 323 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 10.57s 258 832
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 5.27s 222 0

त्वरित तुलना

तुलना जोड़ी बदलें