नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

OpenAI: GPT-5.2 Chat vs Qwen: Qwen3.6 Max Preview

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-27

मेट्रिक GPT-5.2 Chat GPT-5.2 Chat none रिलीज़: 2025-12-11 Qwen3.6 Max Preview Qwen3.6 Max Preview medium रिलीज़: 2026-04-20
स्कोर 7.9 8.8
रैंक #38 #8
विश्वसनीयता लागू नहीं 10.0
संगति 8.7 9.5
सही परीक्षण
प्रति प्रयास पास दर 75.9% 85.2%
अस्थिर टेस्ट 3 1
कुल रन 54 54
प्रति परिणाम लागत 2.424 5.486
कुल लागत $0.291 $0.823
???? ??? $1.750 / 1M $1.300 / 1M
????? ??? $14.000 / 1M $7.800 / 1M
आउटपुट टोकन 17,346 2,158
रीजनिंग टोकन 0 97,495
प्रतिक्रिया समय (औसत) 6.84s 48.31s
प्रतिक्रिया समय (अधिकतम) 38.52s 186.74s
प्रतिक्रिया समय (कुल) 123.17s 869.64s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 8.7 7.9 91.7% 1 3.40s 1,807 0
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 22.13s 228 10,075
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 10.0 10.0 100.0% 0 8.97s 1,345 0
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 117.87s 368 13,790
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 1,243 0
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 121.49s 390 14,575
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.05s 980 0
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 41.15s 270 10,106
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 5.3 10.0 33.3% 0 17.78s 7,810 0
Qwen3.6 Max Preview 2.9 7.2 11.1% 1 95.91s 60 30,371
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 4.4 3.0 33.3% 1 3.20s 335 0
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 32.24s 129 3,510
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 7.5 6.1 83.3% 1 5.46s 1,528 0
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 24.31s 103 5,848
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 7.7 10.0 66.7% 0 4.42s 1,743 0
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 24.19s 301 7,649
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 555 0
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 18.32s 309 1,571

त्वरित तुलना

तुलना जोड़ी बदलें