AI BENCHY
Advertise here
#28

Qwen3.5 Plus 2026-02-15

Qwen प्रकाशन: 2026-02-15 चाचणी तारीख: 2026-06-04 13:17 qwen/qwen3.5-plus-02-15::medium
(medium) (none)

सारांश

Qwen3.5 Plus 2026-02-15 AI BENCHY वर 8.0 स्कोर करते आणि #28 वर आहे. याची reliability 10.0, pass rate 73.0%, एकूण खर्च $0.310, आणि सरासरी response time 73.79s आहे.

Qwen3.5 Plus 2026-02-15 खास का आहे: हे कोडी सोडवणे मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #1 आहे; तर अँटी-एआय युक्त्या हा सर्वात कमकुवत भाग आहे, rank #13.

सुसंगतता

8.8

एकूण खर्च (सध्याची किंमत)

$0.310 ↓ -9.5%

या किमतीवर चाचणी केली: $0.343

एकूण आउटपुट टोकन्स

191,763

एकूण इनपुट टोकन्स

40,918

इनपुट किंमत

$0.260 / 1M

आउटपुट किंमत

$1.560 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 7

प्रति प्रयत्न पास दर: 73.0%

अस्थिर चाचण्या

3

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

73.79s

प्रतिसाद वेळ (कमाल): 266.69s

प्रतिसाद वेळ (एकूण): 1033.07s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#28 Qwen3.5 Plus 2026-02-15

medium
खर्च
$0.011
वेळ
125.5s
टोकन्स
7,040 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 13:17 नवीन चाचणी जोडली 7.9 8.9 $0.310 सध्याची रन
2026-05-21 23:53 सूट बदलला 8.1 10.0 $0.317 तुलना करा
2026-04-11 01:44 पहिली नोंदलेली रन 8.5 लागू नाही $0.220 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रनस्कोअरसुसंगतताविश्वसनीयताबरोबर चाचण्याअस्थिर चाचण्याएकूण आउटपुट टोकन्सएकूण इनपुट टोकन्सएकूण खर्चप्रतिसाद वेळ (सरासरी)
2026-06-04 13:17 · सध्याची रन8.08.810.014/213191,76340,918$0.31073.79s
2026-04-11 01:44 · पहिली नोंदलेली रन8.59.1लागू नाही14/182114,0100$0.22046.56s
फरक-0.5-0.30+1+77753+40918+$0.091+27227ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 15:40 $0.260 / 1M $1.560 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 8.2 7.9
कोडिंग 6.6 7.1
संयुक्त 10.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 5.3 10.0
Samanya Buddhimatta 4.7 1.6
सूचनांचे पालन 10.0 10.0
कोडी सोडवणे 10.0 10.0
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स