नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

OpenAI: GPT-5.3-Codex vs Qwen: Qwen3.7 Max

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-22

मेट्रिक GPT-5.3-Codex GPT-5.3-Codex medium रिलीज़: 2026-02-05 Qwen3.7 Max Qwen3.7 Max medium रिलीज़: 2026-05-22
स्कोर 8.3 9.0
रैंक #15 #5
विश्वसनीयता 10.0 10.0
संगति 8.4 9.6
सही परीक्षण
प्रति प्रयास पास दर 81.7% 88.3%
अस्थिर टेस्ट 4 1
कुल रन 60 60
प्रति परिणाम लागत 4.891 5.540
कुल लागत $0.685 $0.942
???? ??? $1.750 / 1M $2.500 / 1M
????? ??? $14.000 / 1M $7.500 / 1M
आउटपुट टोकन 2,332 2,109
रीजनिंग टोकन 42,616 110,285
प्रतिक्रिया समय (औसत) 15.97s 13.83s
प्रतिक्रिया समय (अधिकतम) 100.93s 33.37s
प्रतिक्रिया समय (कुल) 319.30s 276.53s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 8.7 7.9 91.7% 1 4.16s 240 1,722
Qwen3.7 Max 10.0 10.0 100.0% 0 6.36s 222 8,742
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 10.0 10.0 100.0% 0 18.45s 514 7,266
Qwen3.7 Max 10.0 10.0 100.0% 0 22.98s 403 22,134
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 10.0 10.0 100.0% 0 19.56s 364 2,731
Qwen3.7 Max 10.0 10.0 100.0% 0 19.60s 366 8,405
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.07s 234 728
Qwen3.7 Max 10.0 10.0 100.0% 0 8.80s 270 6,254
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 5.9 7.2 55.6% 1 64.31s 64 25,308
Qwen3.7 Max 5.9 7.2 55.6% 1 24.94s 61 31,793
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 4.6 10.0 0.0% 0 4.87s 187 331
Qwen3.7 Max 10.0 10.0 100.0% 0 11.70s 135 4,457
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.04s 93 693
Qwen3.7 Max 10.0 10.0 100.0% 0 7.46s 102 5,452
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 9.0 7.9 88.9% 1 5.12s 352 1,644
Qwen3.7 Max 10.0 10.0 100.0% 0 8.84s 259 8,908
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 10.0 10.0 100.0% 0 6.37s 254 492
Qwen3.7 Max 10.0 10.0 100.0% 0 6.63s 267 1,220
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 2.8 1.6 33.3% 1 14.43s 30 1,701
Qwen3.7 Max 3.0 10.0 0.0% 0 33.37s 24 12,920

त्वरित तुलना

तुलना जोड़ी बदलें