नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

OpenAI: GPT-5.2 Chat vs Qwen: Qwen3.7 Max

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-22

मेट्रिक GPT-5.2 Chat GPT-5.2 Chat none रिलीज़: 2025-12-11 Qwen3.7 Max Qwen3.7 Max medium रिलीज़: 2026-05-22
स्कोर 7.6 9.0
रैंक #44 #5
विश्वसनीयता 10.0 10.0
संगति 8.5 9.6
सही परीक्षण
प्रति प्रयास पास दर 71.7% 88.3%
अस्थिर टेस्ट 4 1
कुल रन 60 60
प्रति परिणाम लागत 2.955 5.540
कुल लागत $0.355 $0.942
???? ??? $1.750 / 1M $2.500 / 1M
????? ??? $14.000 / 1M $7.500 / 1M
आउटपुट टोकन 21,371 2,109
रीजनिंग टोकन 0 110,285
प्रतिक्रिया समय (औसत) 6.86s 13.83s
प्रतिक्रिया समय (अधिकतम) 38.52s 33.37s
प्रतिक्रिया समय (कुल) 137.19s 276.53s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 8.7 7.9 91.7% 1 3.40s 1,807 0
Qwen3.7 Max 10.0 10.0 100.0% 0 6.36s 222 8,742
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 8.2 6.7 83.3% 1 8.05s 4,131 0
Qwen3.7 Max 10.0 10.0 100.0% 0 22.98s 403 22,134
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 1,243 0
Qwen3.7 Max 10.0 10.0 100.0% 0 19.60s 366 8,405
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.05s 980 0
Qwen3.7 Max 10.0 10.0 100.0% 0 8.80s 270 6,254
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 5.3 10.0 33.3% 0 17.78s 7,810 0
Qwen3.7 Max 5.9 7.2 55.6% 1 24.94s 61 31,793
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 4.4 3.0 33.3% 1 3.20s 335 0
Qwen3.7 Max 10.0 10.0 100.0% 0 11.70s 135 4,457
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 7.3 5.9 83.3% 1 5.46s 1,528 0
Qwen3.7 Max 10.0 10.0 100.0% 0 7.46s 102 5,452
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 7.7 10.0 66.7% 0 4.42s 1,743 0
Qwen3.7 Max 10.0 10.0 100.0% 0 8.84s 259 8,908
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 555 0
Qwen3.7 Max 10.0 10.0 100.0% 0 6.63s 267 1,220
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 3.0 10.0 0.0% 0 6.89s 1,239 0
Qwen3.7 Max 3.0 10.0 0.0% 0 33.37s 24 12,920

त्वरित तुलना

तुलना जोड़ी बदलें