#78

Qwen3.5 Plus 2026-04-20

Qwen प्रकाशन: 2026-04-20 चाचणी तारीख: 2026-07-16 22:06 qwen/qwen3.5-plus-20260420::medium

(medium) (none)

सारांश

Qwen3.5 Plus 2026-04-20 AI BENCHY वर 7.2 स्कोर करते आणि #78 वर आहे. याची reliability 9.6, pass rate 63.6%, एकूण खर्च $0.317, आणि सरासरी response time 46.36s आहे.

Qwen3.5 Plus 2026-04-20 खास का आहे: हे अँटी-एआय युक्त्या मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #1 आहे; तर संयुक्त हा सर्वात कमकुवत भाग आहे, rank #14.

स्कोअर

7.2

सुसंगतता

9.0

विश्वसनीयता

9.6

एकूण खर्च (सध्याची किंमत)

$0.317 ↓ -19.4%

या किमतीवर चाचणी केली: $0.393

एकूण आउटपुट टोकन्स

168,893

एकूण इनपुट टोकन्स

42,097

इनपुट किंमत

$0.300 / 1M

आउटपुट किंमत

$1.800 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 9

प्रति प्रयत्न पास दर: 63.6%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

46.36s

प्रतिसाद वेळ (कमाल): 189.38s

प्रतिसाद वेळ (एकूण): 973.57s

चुकीचे उत्तर: 8 वेळ संपला: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#78 Qwen3.5 Plus 2026-04-20

medium

खर्च: $0.008
वेळ: 76.7s
टोकन्स: 4,355 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-07-16 22:06 नवीन चाचणी जोडली	7.2	9.6	$0.317 ↓	सध्याची रन
2026-06-04 13:15 नवीन चाचणी जोडली	7.6	9.9	$0.317 ↓	तुलना करा
2026-05-21 23:53 सूट बदलला	7.6	9.6	$0.363	तुलना करा
2026-05-08 14:34 सूट बदलला	7.8	9.6	$0.305	तुलना करा
2026-05-08 14:34 सूट बदलला	7.8	9.6	$0.305	तुलना करा
2026-04-27 23:09 पहिला रन	8.2	9.7	$0.269	तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रन	स्कोअर	सुसंगतता	विश्वसनीयता	बरोबर चाचण्या	अस्थिर चाचण्या	एकूण आउटपुट टोकन्स	एकूण इनपुट टोकन्स	एकूण खर्च	प्रतिसाद वेळ (सरासरी)
2026-07-16 22:06 · सध्याची रन	7.2	9.0	9.6	13/22	2	168,893	42,097	$0.317	46.36s
2026-04-27 23:09 · पहिला रन	8.2	9.0	9.7	13/18	2	106,011	0	$0.269	32.81s
फरक	-1.1	0.0	-0.1	0	0	+62882	+42097	+$0.049	+13546ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख	इनपुट किंमत	आउटपुट किंमत
2026-06-04 15:40	$0.300 / 1M	$1.800 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	10.0	10.0
कोडिंग	6.2	8.7
संयुक्त	6.5	10.0
डेटा पार्सिंग आणि निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	2.9	7.2
Samanya Buddhimatta	4.9	9.6
सूचनांचे पालन	10.0	10.0
कोडी सोडवणे	8.2	7.2
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

Qwen3.5 Plus 2026-04-20

Hamster playing table tennis

#78 Qwen3.5 Plus 2026-04-20

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स