नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-5.3 Chat vs Qwen: Qwen3.5-Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-16

मेट्रिक GPT-5.3 Chat GPT-5.3 Chat none रिलीज़: 2026-03-03 Qwen3.5-Flash Qwen3.5-Flash medium रिलीज़: 2026-02-24
स्कोर 7.7 7.8
रैंक #35 #32
संगति 8.6 7.3
सही परीक्षण
प्रति प्रयास पास दर 68.5% 81.5%
अस्थिर टेस्ट 3 6
कुल रन 54 54
प्रति परिणाम लागत 3.082 0.719
कुल लागत $0.340 $0.080
???? ??? $1.750 / 1M $0.065 / 1M
????? ??? $14.000 / 1M $0.260 / 1M
आउटपुट टोकन 20,784 2,073
रीजनिंग टोकन 0 191,899
प्रतिक्रिया समय (औसत) 5.88s 66.72s
प्रतिक्रिया समय (अधिकतम) 18.33s 234.29s
प्रतिक्रिया समय (कुल) 105.90s 1201.03s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 3,167 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 59.11s 383 32,992
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 9.32s 1,436 0
Qwen3.5-Flash 4.7 1.6 66.7% 1 45.75s 246 12,600
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 2,614 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 17.78s 483 8,270
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 942 0
Qwen3.5-Flash 7.3 5.9 83.3% 1 56.99s 235 16,237
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 8,264 0
Qwen3.5-Flash 5.3 7.2 44.4% 1 146.50s 58 43,615
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 319 0
Qwen3.5-Flash 6.1 3.1 66.7% 1 40.05s 99 38,486
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 8.3 10.0 50.0% 0 3.29s 1,455 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 63.49s 98 14,139
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.93s 1,726 0
Qwen3.5-Flash 6.4 4.4 77.8% 2 56.74s 162 24,276
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 861 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 10.33s 309 1,284

त्वरित तुलना

तुलना जोड़ी बदलें