#100

Qwen3 Coder Next

Qwen प्रकाशन: 2026-02-03 चाचणी तारीख: 2026-04-14 00:56 qwen/qwen3-coder-next::medium

(medium) (none)

सारांश

Qwen3 Coder Next AI BENCHY वर 4.7 स्कोर करते आणि #100 वर आहे. याची reliability लागू नाही, pass rate 27.8%, एकूण खर्च $0.008, आणि सरासरी response time 10.75s आहे.

स्कोअर

4.7

सुसंगतता

8.7

विश्वसनीयता

लागू नाही

एकूण खर्च (सध्याची किंमत)

$0.008

एकूण आउटपुट टोकन्स

3,241

एकूण इनपुट टोकन्स

इनपुट किंमत

$0.150 / 1M

आउटपुट किंमत

$0.800 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 15

प्रति प्रयत्न पास दर: 27.8%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

10.75s

प्रतिसाद वेळ (कमाल): 81.80s

प्रतिसाद वेळ (एकूण): 129.01s

चुकीचे उत्तर: 9 सूचनांचे पालन केले नाही: 5 वेळ संपला: 1

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#100 Qwen3 Coder Next

medium

अवैध SVG

खर्च: $0.000
वेळ: 300.0s
टोकन्स: 0 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-06-04 13:09 नवीन चाचणी जोडली	4.6	10.0	$0.008 ↓	तुलना करा
2026-05-21 23:45 सूट बदलला	4.7	10.0	$0.008	तुलना करा
2026-04-14 00:56 पहिली नोंदलेली रन	4.7	लागू नाही	$0.008	सध्याची रन

रन तुलना

रन	स्कोअर	सुसंगतता	विश्वसनीयता	बरोबर चाचण्या	अस्थिर चाचण्या	एकूण आउटपुट टोकन्स	एकूण इनपुट टोकन्स	एकूण खर्च	प्रतिसाद वेळ (सरासरी)
2026-04-14 00:56 · पहिली नोंदलेली रन	4.7	8.7	लागू नाही	3/18	3	3,241	0	$0.008	10.75s
2026-06-04 13:09 · नवीन चाचणी जोडली	4.6	8.9	10.0	4/21	3	3,319	47,250	$0.008	8.58s
फरक	+0.1	-0.2		-1	0	-78	-47250	-$0.001	+2171ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

Qwen3 Coder NextmediumvsLaguna XS 2.1noneमोफत उपलब्ध Qwen3 Coder NextmediumvsQwen3.5-122B-A10Bnone Qwen3 Coder NextmediumvsDeepSeek V3.2none Qwen3 Coder NextmediumvsQwen3.5 Plus 2026-04-20none Qwen3 Coder NextmediumvsMiniMax M2.7medium Qwen3 Coder NextmediumvsGemini 3.5 Flashhigh Qwen3 Coder NextmediumvsGemini 3 Flash Previewmedium Qwen3 Coder NextmediumvsNemotron 3 Ultra 550b A55bmediumमोफत उपलब्ध Qwen3 Coder NextmediumvsGPT-5.5low

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	3.5	8.1
कोडिंग	4.7	1.6
संयुक्त	3.0	10.0
डेटा पार्सिंग आणि निष्कर्षण	6.5	10.0
डोमेन-विशिष्ट	5.3	10.0
Samanya Buddhimatta	6.3	3.4
सूचनांचे पालन	4.8	10.0
कोडी सोडवणे	3.1	10.0
टूल कॉलिंग	10.0	10.0

Qwen3 Coder Next

Hamster playing table tennis

#100 Qwen3 Coder Next

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स