नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-5.4 vs Qwen: Qwen3 Coder Next

सारांश

GPT-5.4 vs Qwen3 Coder Next benchmark तुलना: GPT-5.4 average score में आगे है: 5.8 vs 5.1. Qwen3 Coder Next की benchmark लागत कम है: $0.009 vs $0.122. GPT-5.4 तेज है: 1.42s vs 8.62s, pass rates 36.5% vs 27.0%.

अनुशंसित मॉडल: GPT-5.4 - It has the best score here (5.8), while responding about 6.1x faster than Qwen3 Coder Next.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-02

मेट्रिक GPT-5.4 GPT-5.4 none रिलीज़: 2026-03-05 Qwen3 Coder Next Qwen3 Coder Next none रिलीज़: 2026-02-03
स्कोर 5.8 5.1
रैंक #115 #135
विश्वसनीयता 10.0 10.0
संगति 9.2 9.7
सही परीक्षण
प्रति प्रयास पास दर 36.5% 27.0%
अस्थिर टेस्ट 2 1
कुल रन 63 63
प्रति परिणाम लागत 1.740 0.165
कुल लागत $0.122 $0.009
इनपुट कीमत $2.500 / 1M $0.110 / 1M
आउटपुट कीमत $15.000 / 1M $0.800 / 1M
कुल इनपुट टोकन 34,212 47,507
आउटपुट टोकन 2,417 3,584
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.42s 8.62s
प्रतिक्रिया समय (अधिकतम) 2.95s 45.14s
प्रतिक्रिया समय (कुल) 29.87s 129.37s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#115 GPT-5.4

none
लागत
$0.026
समय
18.1s
टोकन
1,792 tok

#135 Qwen3 Coder Next

none
अमान्य SVG
लागत
$0.058
समय
246.3s
टोकन
64,126 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 3.2 8.0 8.3% 1 1.21s 606 406 0
Qwen3 Coder Next 3.6 10.0 0.0% 0 3.31s 645 1,321 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 5.5 10.0 33.3% 0 1.62s 7,305 516 0
Qwen3 Coder Next 4.6 7.9 22.2% 1 2.22s 7,442 621 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 3.0 10.0 0.0% 0 2.89s 11,019 291 0
Qwen3 Coder Next 3.0 10.0 0.0% 0 45.14s 20,469 317 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 1.04s 7,140 222 0
Qwen3 Coder Next 6.5 10.0 50.0% 0 1.32s 7,758 246 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 5.3 7.2 44.4% 1 1.07s 723 50 0
Qwen3 Coder Next 5.3 10.0 33.3% 0 962ms 753 26 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 4.4 9.9 0.0% 0 1.78s 477 184 0
Qwen3 Coder Next 10.0 10.0 100.0% 0 1.34s 498 152 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 6.5 10.0 50.0% 0 1.07s 660 81 0
Qwen3 Coder Next 6.3 10.0 50.0% 0 7.78s 684 63 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 5.6 9.8 33.3% 0 1.44s 642 381 0
Qwen3 Coder Next 3.0 10.0 0.0% 0 24.34s 678 571 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 2.75s 5,445 246 0
Qwen3 Coder Next 10.0 10.0 100.0% 0 2.47s 8,364 255 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 3.0 10.0 0.0% 0 990ms 195 40 0
Qwen3 Coder Next 3.0 10.0 0.0% 0 601ms 216 12 0

त्वरित तुलना

तुलना जोड़ी बदलें