नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

OpenAI: GPT-5.2 Chat vs Qwen: Qwen3.6 Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-27

मेट्रिक GPT-5.2 Chat GPT-5.2 Chat none रिलीज़: 2025-12-11 Qwen3.6 Flash Qwen3.6 Flash medium रिलीज़: 2026-04-20
स्कोर 7.9 8.1
रैंक #38 #24
विश्वसनीयता लागू नहीं 10.0
संगति 8.7 8.2
सही परीक्षण
प्रति प्रयास पास दर 75.9% 79.6%
अस्थिर टेस्ट 3 4
कुल रन 54 54
प्रति परिणाम लागत 2.424 1.449
कुल लागत $0.291 $0.174
???? ??? $1.750 / 1M $0.250 / 1M
????? ??? $14.000 / 1M $1.500 / 1M
आउटपुट टोकन 17,346 2,804
रीजनिंग टोकन 0 107,210
प्रतिक्रिया समय (औसत) 6.84s 9.90s
प्रतिक्रिया समय (अधिकतम) 38.52s 26.85s
प्रतिक्रिया समय (कुल) 123.17s 178.26s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 8.7 7.9 91.7% 1 3.40s 1,807 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 6.10s 624 14,024
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 10.0 10.0 100.0% 0 8.97s 1,345 0
Qwen3.6 Flash 6.7 3.5 66.7% 1 25.84s 435 17,044
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 1,243 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 20.28s 483 13,839
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.05s 980 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 9.65s 270 13,155
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 5.3 10.0 33.3% 0 17.78s 7,810 0
Qwen3.6 Flash 3.5 4.4 33.3% 2 14.65s 60 24,409
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 4.4 3.0 33.3% 1 3.20s 335 0
Qwen3.6 Flash 4.8 9.9 0.0% 0 9.88s 140 5,445
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 7.5 6.1 83.3% 1 5.46s 1,528 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 6.05s 102 7,423
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 7.7 10.0 66.7% 0 4.42s 1,743 0
Qwen3.6 Flash 8.2 7.2 88.9% 1 6.17s 355 10,683
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 555 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 4.00s 335 1,188

त्वरित तुलना

तुलना जोड़ी बदलें