नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-5.3-Codex vs Qwen3.6 Plus Preview

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-30

मेट्रिक GPT-5.3-Codex GPT-5.3-Codex medium रिलीज़: 2026-02-05 Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium रिलीज़: रिलीज़ तिथि अज्ञात निःशुल्क उपलब्ध
स्कोर 8.5 8.5
रैंक #7 #6
संगति 8.6 10.0
सही परीक्षण
प्रति प्रयास पास दर 82.4% 76.5%
अस्थिर टेस्ट 3 0
कुल रन 51 49
प्रति परिणाम लागत 4.526 0.000
कुल लागत $0.544 $0.000
???? ??? $1.750 / 1M $0.000 / 1M
????? ??? $14.000 / 1M $0.000 / 1M
आउटपुट टोकन 1,788 1,756
रीजनिंग टोकन 33,649 77,213
प्रतिक्रिया समय (औसत) 15.76s 13.94s
प्रतिक्रिया समय (अधिकतम) 100.93s 43.55s
प्रतिक्रिया समय (कुल) 267.97s 237.01s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 8.7 7.9 91.7% 1 4.16s 240 1,722
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 9.90s 207 7,557
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 10.0 10.0 100.0% 0 19.56s 364 2,731
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 34.95s 452 13,073
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.07s 234 728
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 14.95s 270 10,706
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 5.9 7.2 55.6% 1 64.31s 64 25,308
Qwen3.6 Plus Preview 3.0 10.0 0.0% 0 22.08s 49 26,895
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 4.6 10.0 0.0% 0 4.87s 187 331
Qwen3.6 Plus Preview 5.1 10.0 0.0% 0 27.05s 111 5,232
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.04s 93 693
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 7.54s 102 5,552
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 9.0 7.9 88.9% 1 5.12s 352 1,644
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 6.11s 298 6,868
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 10.0 10.0 100.0% 0 6.37s 254 492
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 5.87s 267 1,330

त्वरित तुलना

तुलना जोड़ी बदलें