#132

Qwen3 Coder Next

Qwen रिलीज़: 2026-02-03 परीक्षण किया गया: 2026-05-21 23:44 qwen/qwen3-coder-next::none

(medium) (none)

सारांश

Qwen3 Coder Next AI BENCHY पर 5.1 स्कोर करता है और #132 पर है। इसकी reliability 10.0, pass rate 28.3%, कुल लागत $0.008, और औसत response time 8.83s है।

Qwen3 Coder Next को अलग क्या बनाता है: यह Samanya Buddhimatta में सबसे अलग दिखता है, जहाँ इसकी रैंक #1 है; जबकि पहेली समाधान इसकी सबसे कमजोर जगह है, जहाँ यह #14 पर है।

स्कोर

5.1

संगति

9.7

विश्वसनीयता

10.0

कुल लागत (वर्तमान कीमत)

$0.008

कुल आउटपुट टोकन

3,656

कुल इनपुट टोकन

इनपुट कीमत

$0.110 / 1M

आउटपुट कीमत

$0.800 / 1M

सही परीक्षण

गलत टेस्ट: 15

प्रति प्रयास पास दर: 28.3%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

8.83s

प्रतिक्रिया समय (अधिकतम): 45.14s

प्रतिक्रिया समय (कुल): 123.62s

गलत उत्तर: 13 अतिरिक्त फॉर्मेटिंग: 1 निर्देशों का पालन नहीं किया: 1

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#132 Qwen3 Coder Next

none

अमान्य SVG

लागत: $0.058
समय: 246.3s
टोकन: 64,126 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-06-04 13:09 नया टेस्ट जोड़ा गया	4.9	10.0	$0.009 ↓	तुलना करें
2026-05-21 23:44 सूट बदला गया	5.1	10.0	$0.008	वर्तमान रन
2026-04-14 00:56 पहला दर्ज रन	5.1	लागू नहीं	$0.008	तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

Qwen3 Coder NextnonevsGPT-5.4none Qwen3 Coder NextnonevsGemini 3.5 Flashhigh Qwen3 Coder NextnonevsGemini 3 Flash Previewmedium Qwen3 Coder NextnonevsNemotron 3 Ultra 550b A55bmediumनिःशुल्क उपलब्ध Qwen3 Coder NextnonevsGPT-5.5low

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	3.6	10.0
कोडिंग	5.4	6.9
संयुक्त	3.0	10.0
डेटा पार्सिंग और निष्कर्षण	6.5	10.0
डोमेन-विशिष्ट	5.3	10.0
Samanya Buddhimatta	10.0	10.0
निर्देश पालन	6.3	10.0
पहेली समाधान	3.0	10.0
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

Qwen3 Coder Next

Hamster playing table tennis

#132 Qwen3 Coder Next

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल