नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-5.3-Codex vs Qwen: Qwen3.7 Max

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-22

मेट्रिक GPT-5.3-Codex GPT-5.3-Codex medium रिलीज़: 2026-02-05 Qwen3.7 Max Qwen3.7 Max none रिलीज़: 2026-05-22
स्कोर 8.3 7.9
रैंक #15 #26
विश्वसनीयता 10.0 10.0
संगति 8.4 10.0
सही परीक्षण
प्रति प्रयास पास दर 81.7% 70.0%
अस्थिर टेस्ट 4 0
कुल रन 60 60
प्रति परिणाम लागत 4.891 0.719
कुल लागत $0.685 $0.101
???? ??? $1.750 / 1M $2.500 / 1M
????? ??? $14.000 / 1M $7.500 / 1M
आउटपुट टोकन 2,332 1,988
रीजनिंग टोकन 42,616 0
प्रतिक्रिया समय (औसत) 15.97s 1.30s
प्रतिक्रिया समय (अधिकतम) 100.93s 3.92s
प्रतिक्रिया समय (कुल) 319.30s 25.95s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 8.7 7.9 91.7% 1 4.16s 240 1,722
Qwen3.7 Max 6.5 10.0 50.0% 0 1.08s 242 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 10.0 10.0 100.0% 0 18.45s 514 7,266
Qwen3.7 Max 6.8 10.0 50.0% 0 1.39s 576 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 10.0 10.0 100.0% 0 19.56s 364 2,731
Qwen3.7 Max 3.0 10.0 0.0% 0 2.17s 171 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.07s 234 728
Qwen3.7 Max 10.0 10.0 100.0% 0 1.35s 243 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 5.9 7.2 55.6% 1 64.31s 64 25,308
Qwen3.7 Max 7.7 10.0 66.7% 0 975ms 15 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 4.6 10.0 0.0% 0 4.87s 187 331
Qwen3.7 Max 10.0 10.0 100.0% 0 1.04s 120 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.04s 93 693
Qwen3.7 Max 10.0 10.0 100.0% 0 943ms 72 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 9.0 7.9 88.9% 1 5.12s 352 1,644
Qwen3.7 Max 10.0 10.0 100.0% 0 1.13s 314 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 10.0 10.0 100.0% 0 6.37s 254 492
Qwen3.7 Max 10.0 10.0 100.0% 0 3.92s 222 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 2.8 1.6 33.3% 1 14.43s 30 1,701
Qwen3.7 Max 3.0 10.0 0.0% 0 856ms 13 0

त्वरित तुलना

तुलना जोड़ी बदलें