नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-5.2 vs Qwen: Qwen3.6 Max Preview

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-27

मेट्रिक GPT-5.2 GPT-5.2 medium रिलीज़: 2025-12-11 Qwen3.6 Max Preview Qwen3.6 Max Preview none रिलीज़: 2026-04-20
स्कोर 7.5 7.3
रैंक #52 #56
विश्वसनीयता लागू नहीं 10.0
संगति 8.1 8.7
सही परीक्षण
प्रति प्रयास पास दर 72.2% 66.7%
अस्थिर टेस्ट 4 3
कुल रन 54 54
प्रति परिणाम लागत 3.193 0.827
कुल लागत $0.352 $0.083
???? ??? $1.750 / 1M $1.300 / 1M
????? ??? $14.000 / 1M $7.800 / 1M
आउटपुट टोकन 2,705 4,732
रीजनिंग टोकन 18,977 0
प्रतिक्रिया समय (औसत) 14.04s 3.38s
प्रतिक्रिया समय (अधिकतम) 77.80s 20.51s
प्रतिक्रिया समय (कुल) 154.41s 60.83s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 6.5 8.0 58.3% 1 7.81s 567 2,002
Qwen3.6 Max Preview 5.2 7.9 41.7% 1 2.63s 513 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 10.0 10.0 100.0% 0 15.12s 467 2,166
Qwen3.6 Max Preview 5.0 2.0 66.7% 1 3.45s 426 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 10.0 10.0 100.0% 0 14.06s 291 1,757
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 20.51s 2,842 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 10.0 10.0 100.0% 0 3.15s 234 420
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.87s 243 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 5.9 7.2 55.6% 1 77.80s 42 10,342
Qwen3.6 Max Preview 7.7 10.0 66.7% 0 1.22s 18 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 3.7 9.7 0.0% 0 4.32s 162 269
Qwen3.6 Max Preview 4.3 10.0 0.0% 0 1.62s 76 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 9.9 10.0 100.0% 0 3.12s 94 614
Qwen3.6 Max Preview 8.4 6.9 83.3% 1 1.45s 69 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 7.7 7.3 77.8% 1 5.47s 609 938
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.38s 323 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 4.7 1.6 66.7% 1 10.30s 239 469
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 5.27s 222 0

त्वरित तुलना

तुलना जोड़ी बदलें