Qwen3.5 Plus 2026-02-15

Qwen प्रकाशन: 2026-02-15 चाचणी तारीख: 2026-04-11 01:44 qwen/qwen3.5-plus-02-15::medium

(medium) (none)

सारांश

Qwen3.5 Plus 2026-02-15 AI BENCHY वर 8.5 स्कोर करते आणि #8 वर आहे. याची reliability लागू नाही, pass rate 83.3%, एकूण खर्च $0.220, आणि सरासरी response time 46.56s आहे.

Qwen3.5 Plus 2026-02-15 खास का आहे: या score range साठी एकूण benchmark खर्च असामान्यपणे कमी आहे.

स्कोअर

8.5

सुसंगतता

9.1

विश्वसनीयता

लागू नाही

एकूण खर्च (सध्याची किंमत)

$0.220

एकूण आउटपुट टोकन्स

114,010

एकूण इनपुट टोकन्स

इनपुट किंमत

$0.260 / 1M

आउटपुट किंमत

$1.560 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 4

प्रति प्रयत्न पास दर: 83.3%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

46.56s

प्रतिसाद वेळ (कमाल): 120.91s

प्रतिसाद वेळ (एकूण): 512.20s

वेळ संपला: 2 चुकीचे उत्तर: 2

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#8 Qwen3.5 Plus 2026-02-15

medium

खर्च: $0.011
वेळ: 125.5s
टोकन्स: 7,040 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-06-04 13:17 नवीन चाचणी जोडली	7.9	8.9	$0.310 ↓	तुलना करा
2026-05-21 23:53 सूट बदलला	8.1	10.0	$0.317	तुलना करा
2026-04-11 01:44 पहिली नोंदलेली रन	8.5	लागू नाही	$0.220	सध्याची रन

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

Qwen3.5 Plus 2026-02-15mediumvsNemotron 3 Ultra 550b A55bmediumमोफत उपलब्ध Qwen3.5 Plus 2026-02-15mediumvsQwen3.7 Plusmedium Qwen3.5 Plus 2026-02-15mediumvsQwen3.5-27Bmedium Qwen3.5 Plus 2026-02-15mediumvsGemini 2.5 Flashmedium Qwen3.5 Plus 2026-02-15mediumvsClaude Sonnet 5medium Qwen3.5 Plus 2026-02-15mediumvsGemini 3.5 Flashhigh Qwen3.5 Plus 2026-02-15mediumvsGemini 3 Flash Previewmedium Qwen3.5 Plus 2026-02-15mediumvsGPT-5.5low

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	8.2	7.9
कोडिंग	10.0	10.0
संयुक्त	10.0	10.0
डेटा पार्सिंग आणि निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	5.3	10.0
Samanya Buddhimatta	4.7	1.6
सूचनांचे पालन	10.0	10.0
कोडी सोडवणे	10.0	10.0
टूल कॉलिंग	10.0	10.0

Qwen3.5 Plus 2026-02-15

Hamster playing table tennis

#8 Qwen3.5 Plus 2026-02-15

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स