नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

OpenAI: GPT-5.5 vs Qwen: Qwen3.6 27B

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-27

मेट्रिक GPT-5.5 GPT-5.5 none रिलीज़: 2026-04-24 Qwen3.6 27B Qwen3.6 27B medium रिलीज़: 2026-04-20
स्कोर 6.8 7.0
रैंक #65 #60
विश्वसनीयता लागू नहीं 10.0
संगति 8.3 7.9
सही परीक्षण
प्रति प्रयास पास दर 61.1% 64.8%
अस्थिर टेस्ट 4 5
कुल रन 54 54
प्रति परिणाम लागत 2.162 2.321
कुल लागत $0.195 $0.209
???? ??? $5.000 / 1M $0.500 / 1M
????? ??? $30.000 / 1M $2.000 / 1M
आउटपुट टोकन 1,910 8,279
रीजनिंग टोकन 0 91,083
प्रतिक्रिया समय (औसत) 1.83s 50.53s
प्रतिक्रिया समय (अधिकतम) 5.56s 168.22s
प्रतिक्रिया समय (कुल) 32.86s 909.49s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 6.9 7.9 66.7% 1 1.31s 213 0
Qwen3.6 27B 8.3 10.0 75.0% 0 12.62s 582 4,311
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 2.05s 426 0
Qwen3.6 27B 10.0 10.0 100.0% 0 168.22s 433 17,861
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 3.0 10.0 0.0% 0 5.56s 300 0
Qwen3.6 27B 7.0 3.7 66.7% 1 83.07s 2,088 14,689
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 1.18s 222 0
Qwen3.6 27B 3.5 1.4 50.0% 2 37.30s 568 9,404
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 2.9 7.2 11.1% 1 1.31s 52 0
Qwen3.6 27B 2.9 7.2 11.1% 1 73.38s 3,510 20,352
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 3.41s 124 0
Qwen3.6 27B 6.5 3.4 66.7% 1 39.53s 81 3,045
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 6.2 5.8 66.7% 1 1.15s 81 0
Qwen3.6 27B 10.0 10.0 100.0% 0 37.96s 346 6,548
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 6.7 7.9 55.6% 1 1.36s 245 0
Qwen3.6 27B 7.7 10.0 66.7% 0 60.21s 281 11,919
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 3.90s 247 0
Qwen3.6 27B 10.0 10.0 100.0% 0 16.88s 390 2,954

त्वरित तुलना

तुलना जोड़ी बदलें