नेविगेशन
AI BENCHY
तुलना करें चार्ट
❤️ Made by XCS
Your ad here

AI BENCHY तुलना

OpenAI: GPT-5.4 vs Qwen: Qwen3 Coder Next

तुलना करें:

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-05

मेट्रिक OpenAI: GPT-5.4 none रिलीज़: 2026-03-05 Qwen: Qwen3 Coder Next medium रिलीज़: 2026-02-03
रैंक #44 #51
औसत स्कोर 4.6 3.3
सही परीक्षण
संगति 8.9 9.5
प्रति परिणाम लागत 1.496 0.224
कुल लागत $0.090 $0.007
प्रति प्रयास पास दर 44.4% 24.4%
अस्थिर टेस्ट 2 1
common.totalAttempts 45 (15 x 3) 45 (15 x 3)
आउटपुट टोकन 1,635 2,793
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.46s 13.77s
प्रतिक्रिया समय (अधिकतम) 2.89s 81.80s
प्रतिक्रिया समय (कुल) 21.86s 123.93s

स्कोर के अनुसार शीर्ष मॉडल

प्रतिक्रिया समय (औसत)

स्कोर बनाम कुल लागत

औसत स्कोर vs प्रतिक्रिया समय (औसत)

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-5.4 10.0 7.3 11.1% 1 1.41s 388 0
Qwen: Qwen3 Coder Next 1.3 7.5 22.2% 1 15.28s 1,246 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-5.4 10.0 10.0 0.0% 0 2.89s 291 0
Qwen: Qwen3 Coder Next 10.0 10.0 0.0% 0 4.28s 317 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-5.4 9.9 10.0 100.0% 0 1.04s 222 0
Qwen: Qwen3 Coder Next 5.4 10.0 50.0% 0 81.80s 246 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-5.4 4.0 7.2 44.4% 1 1.07s 50 0
Qwen: Qwen3 Coder Next 4.0 10.0 33.3% 0 638ms 25 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-5.4 5.5 10.0 50.0% 0 1.07s 81 0
Qwen: Qwen3 Coder Next 4.5 10.0 0.0% 0 7.34s 63 0
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-5.4 4.0 9.8 33.3% 0 1.52s 357 0
Qwen: Qwen3 Coder Next 10.0 10.0 0.0% 0 2.30s 641 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0
Qwen: Qwen3 Coder Next 10.0 10.0 100.0% 0 2.64s 255 0

त्वरित तुलना

तुलना जोड़ी बदलें