#94

Qwen3 Coder Next

Qwen रिलीज़: 2026-02-03 परीक्षण किया गया: 2026-04-14 00:56 qwen/qwen3-coder-next::none

(medium) (none)

सारांश

Qwen3 Coder Next AI BENCHY पर 5.1 स्कोर करता है और #94 पर है। इसकी reliability लागू नहीं, pass rate 25.9%, कुल लागत $0.008, और औसत response time 10.18s है।

Qwen3 Coder Next को अलग क्या बनाता है: यह कोडिंग में सबसे अलग दिखता है, जहाँ इसकी रैंक #1 है; जबकि डेटा पार्सिंग और निष्कर्षण इसकी सबसे कमजोर जगह है, जहाँ यह #14 पर है।

स्कोर

5.1

संगति

9.7

विश्वसनीयता

लागू नहीं

कुल लागत (वर्तमान कीमत)

$0.008

कुल आउटपुट टोकन

3,617

कुल इनपुट टोकन

इनपुट कीमत

$0.150 / 1M

आउटपुट कीमत

$0.800 / 1M

सही परीक्षण

गलत टेस्ट: 14

प्रति प्रयास पास दर: 25.9%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

10.18s

प्रतिक्रिया समय (अधिकतम): 45.14s

प्रतिक्रिया समय (कुल): 122.13s

गलत उत्तर: 12 अतिरिक्त फॉर्मेटिंग: 1 निर्देशों का पालन नहीं किया: 1

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#94 Qwen3 Coder Next

none

अमान्य SVG

लागत: $0.058
समय: 246.3s
टोकन: 64,126 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-06-04 13:09 नया टेस्ट जोड़ा गया	4.9	10.0	$0.009 ↓	तुलना करें
2026-05-21 23:44 सूट बदला गया	5.1	10.0	$0.008	तुलना करें
2026-04-14 00:56 पहला दर्ज रन	5.1	लागू नहीं	$0.008	वर्तमान रन

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

Qwen3 Coder NextnonevsGPT-5.4none Qwen3 Coder NextnonevsGemini 3.5 Flashhigh Qwen3 Coder NextnonevsGemini 3 Flash Previewmedium Qwen3 Coder NextnonevsNemotron 3 Ultra 550b A55bmediumनिःशुल्क उपलब्ध Qwen3 Coder NextnonevsGPT-5.5low

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	3.6	10.0
कोडिंग	7.3	3.7
संयुक्त	3.0	10.0
डेटा पार्सिंग और निष्कर्षण	6.5	10.0
डोमेन-विशिष्ट	5.3	10.0
Samanya Buddhimatta	10.0	10.0
निर्देश पालन	4.8	10.0
पहेली समाधान	3.2	10.0
टूल कॉलिंग	10.0	10.0

Qwen3 Coder Next

Hamster playing table tennis

#94 Qwen3 Coder Next

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल