नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

OpenAI: GPT-5.3-Codex vs Qwen3.6 Plus

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-02

मेट्रिक GPT-5.3-Codex GPT-5.3-Codex medium रिलीज़: 2026-02-05 Qwen3.6 Plus Qwen3.6 Plus medium रिलीज़: 2026-04-02 निःशुल्क उपलब्ध
स्कोर 8.5 8.4
रैंक #8 #9
संगति 8.6 9.5
सही परीक्षण
प्रति प्रयास पास दर 82.4% 78.4%
अस्थिर टेस्ट 3 1
कुल रन 51 51
प्रति परिणाम लागत 4.526 0.000
कुल लागत $0.544 $0.000
???? ??? $1.750 / 1M $0.000 / 1M
????? ??? $14.000 / 1M $0.000 / 1M
आउटपुट टोकन 1,788 1,763
रीजनिंग टोकन 33,649 83,782
प्रतिक्रिया समय (औसत) 15.76s 15.27s
प्रतिक्रिया समय (अधिकतम) 100.93s 43.55s
प्रतिक्रिया समय (कुल) 267.97s 259.55s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 8.7 7.9 91.7% 1 4.16s 240 1,722
Qwen3.6 Plus 10.0 10.0 100.0% 0 9.90s 207 7,557
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 10.0 10.0 100.0% 0 19.56s 364 2,731
Qwen3.6 Plus 10.0 10.0 100.0% 0 34.95s 452 13,073
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.07s 234 728
Qwen3.6 Plus 10.0 10.0 100.0% 0 14.95s 270 10,706
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 5.9 7.2 55.6% 1 64.31s 64 25,308
Qwen3.6 Plus 2.9 7.2 11.1% 1 29.59s 56 33,464
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 4.6 10.0 0.0% 0 4.87s 187 331
Qwen3.6 Plus 5.1 10.0 0.0% 0 27.05s 111 5,232
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.04s 93 693
Qwen3.6 Plus 10.0 10.0 100.0% 0 7.54s 102 5,552
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 9.0 7.9 88.9% 1 5.12s 352 1,644
Qwen3.6 Plus 10.0 10.0 100.0% 0 6.11s 298 6,868
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3-Codex 10.0 10.0 100.0% 0 6.37s 254 492
Qwen3.6 Plus 10.0 10.0 100.0% 0 5.87s 267 1,330

त्वरित तुलना

तुलना जोड़ी बदलें