#88

Qwen3.5 Plus 2026-04-20

Qwen प्रकाशन: 2026-04-20 चाचणी तारीख: 2026-04-27 23:05 qwen/qwen3.5-plus-20260420::none

(medium) (none)

सारांश

Qwen3.5 Plus 2026-04-20 AI BENCHY वर 5.8 स्कोर करते आणि #88 वर आहे. याची reliability 9.8, pass rate 42.6%, एकूण खर्च $0.024, आणि सरासरी response time 3.18s आहे.

Qwen3.5 Plus 2026-04-20 खास का आहे: हे डोमेन-विशिष्ट मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #2 आहे; तर संयुक्त हा सर्वात कमकुवत भाग आहे, rank #9.

स्कोअर

5.8

सुसंगतता

8.3

विश्वसनीयता

9.8

एकूण खर्च (सध्याची किंमत)

$0.024

एकूण आउटपुट टोकन्स

4,645

एकूण इनपुट टोकन्स

इनपुट किंमत

$0.400 / 1M

आउटपुट किंमत

$2.400 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 12

प्रति प्रयत्न पास दर: 42.6%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

3.18s

प्रतिसाद वेळ (कमाल): 13.32s

प्रतिसाद वेळ (एकूण): 57.24s

चुकीचे उत्तर: 10 सूचनांचे पालन केले नाही: 2

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#88 Qwen3.5 Plus 2026-04-20

none

Cost: $0.008
Time: 77.0s
Tokens: 4,369 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-06-04 13:10 नवीन चाचणी जोडली	5.7	10.0	$0.032 ↓	तुलना करा
2026-05-21 23:47 सूट बदलला	5.8	9.9	$0.041	तुलना करा
2026-05-08 13:10 सूट बदलला	5.9	9.9	$0.040	तुलना करा
2026-05-08 13:10 सूट बदलला	5.9	9.9	$0.040	तुलना करा
2026-04-27 23:05 पहिला रन	5.8	9.8	$0.024	सध्याची रन

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

Qwen3.5 Plus 2026-04-20nonevsGPT-5 Nanomedium Qwen3.5 Plus 2026-04-20nonevsGPT-5.5none Qwen3.5 Plus 2026-04-20nonevsQwen3.5 Plus 2026-02-15none Qwen3.5 Plus 2026-04-20nonevsGemini 3.1 Flash Litenone Qwen3.5 Plus 2026-04-20nonevsRing-2.6-1Tnone Qwen3.5 Plus 2026-04-20nonevsGemini 3 Flash Previewmedium Qwen3.5 Plus 2026-04-20nonevsGemini 3.5 Flashhigh Qwen3.5 Plus 2026-04-20nonevsNemotron 3 Ultra 550b A55bmediumमोफत उपलब्ध Qwen3.5 Plus 2026-04-20nonevsGemini 3.5 Flashlow

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	4.8	10.0
कोडिंग	5.3	3.4
संयुक्त	2.8	1.6
डेटा पार्सिंग आणि निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	5.3	10.0
Samanya Buddhimatta	4.8	10.0
सूचनांचे पालन	6.2	5.8
कोडी सोडवणे	4.8	7.9
टूल कॉलिंग	10.0	10.0

Qwen3.5 Plus 2026-04-20

Hamster playing table tennis

#88 Qwen3.5 Plus 2026-04-20

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स