नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

OpenAI: GPT-5.3 Chat vs Qwen: Qwen3.6 27B

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-27

मेट्रिक GPT-5.3 Chat GPT-5.3 Chat none रिलीज़: 2026-03-03 Qwen3.6 27B Qwen3.6 27B medium रिलीज़: 2026-04-20
स्कोर 7.7 7.0
रैंक #48 #60
विश्वसनीयता लागू नहीं 10.0
संगति 8.6 7.9
सही परीक्षण
प्रति प्रयास पास दर 68.5% 64.8%
अस्थिर टेस्ट 3 5
कुल रन 54 54
प्रति परिणाम लागत 3.082 2.321
कुल लागत $0.340 $0.209
???? ??? $1.750 / 1M $0.500 / 1M
????? ??? $14.000 / 1M $2.000 / 1M
आउटपुट टोकन 20,784 8,279
रीजनिंग टोकन 0 91,083
प्रतिक्रिया समय (औसत) 5.88s 50.53s
प्रतिक्रिया समय (अधिकतम) 18.33s 168.22s
प्रतिक्रिया समय (कुल) 105.90s 909.49s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 3,167 0
Qwen3.6 27B 8.3 10.0 75.0% 0 12.62s 582 4,311
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 9.32s 1,436 0
Qwen3.6 27B 10.0 10.0 100.0% 0 168.22s 433 17,861
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 2,614 0
Qwen3.6 27B 7.0 3.7 66.7% 1 83.07s 2,088 14,689
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 942 0
Qwen3.6 27B 3.5 1.4 50.0% 2 37.30s 568 9,404
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 8,264 0
Qwen3.6 27B 2.9 7.2 11.1% 1 73.38s 3,510 20,352
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 319 0
Qwen3.6 27B 6.5 3.4 66.7% 1 39.53s 81 3,045
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 8.3 10.0 50.0% 0 3.29s 1,455 0
Qwen3.6 27B 10.0 10.0 100.0% 0 37.96s 346 6,548
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.93s 1,726 0
Qwen3.6 27B 7.7 10.0 66.7% 0 60.21s 281 11,919
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 861 0
Qwen3.6 27B 10.0 10.0 100.0% 0 16.88s 390 2,954

त्वरित तुलना

तुलना जोड़ी बदलें