नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-5.5 vs Qwen: Qwen3.7 Max

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-22

मेट्रिक GPT-5.5 GPT-5.5 medium रिलीज़: 2026-04-24 Qwen3.7 Max Qwen3.7 Max medium रिलीज़: 2026-05-22
स्कोर 8.7 9.0
रैंक #11 #5
विश्वसनीयता 10.0 10.0
संगति 8.8 9.6
सही परीक्षण
प्रति प्रयास पास दर 86.7% 88.3%
अस्थिर टेस्ट 3 1
कुल रन 60 60
प्रति परिणाम लागत 21.891 5.540
कुल लागत $3.503 $0.942
???? ??? $5.000 / 1M $2.500 / 1M
????? ??? $30.000 / 1M $7.500 / 1M
आउटपुट टोकन 1,973 2,109
रीजनिंग टोकन 109,510 110,285
प्रतिक्रिया समय (औसत) 37.89s 13.83s
प्रतिक्रिया समय (अधिकतम) 332.10s 33.37s
प्रतिक्रिया समय (कुल) 757.71s 276.53s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 4.66s 250 1,335
Qwen3.7 Max 10.0 10.0 100.0% 0 6.36s 222 8,742
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 8.2 6.7 83.3% 1 69.68s 341 19,515
Qwen3.7 Max 10.0 10.0 100.0% 0 22.98s 403 22,134
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 19.29s 312 2,841
Qwen3.7 Max 10.0 10.0 100.0% 0 19.60s 366 8,405
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 4.18s 234 593
Qwen3.7 Max 10.0 10.0 100.0% 0 8.80s 270 6,254
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 5.3 7.2 44.4% 1 164.14s 67 79,625
Qwen3.7 Max 5.9 7.2 55.6% 1 24.94s 61 31,793
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 4.16s 138 223
Qwen3.7 Max 10.0 10.0 100.0% 0 11.70s 135 4,457
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 3.36s 93 538
Qwen3.7 Max 10.0 10.0 100.0% 0 7.46s 102 5,452
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 6.78s 250 2,254
Qwen3.7 Max 10.0 10.0 100.0% 0 8.84s 259 8,908
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 10.57s 258 832
Qwen3.7 Max 10.0 10.0 100.0% 0 6.63s 267 1,220
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 2.8 1.6 33.3% 1 37.86s 30 1,754
Qwen3.7 Max 3.0 10.0 0.0% 0 33.37s 24 12,920

त्वरित तुलना

तुलना जोड़ी बदलें