AI BENCHY
Advertise here
#106

Qwen3.5 Plus 2026-02-15

Qwen प्रकाशन: 2026-02-15 चाचणी तारीख: 2026-06-04 13:10 qwen/qwen3.5-plus-02-15::none
(medium) (none)

सारांश

Qwen3.5 Plus 2026-02-15 AI BENCHY वर 5.8 स्कोर करते आणि #106 वर आहे. याची reliability 10.0, pass rate 46.0%, एकूण खर्च $0.016, आणि सरासरी response time 2.31s आहे.

Qwen3.5 Plus 2026-02-15 खास का आहे: हे कोडी सोडवणे मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #2 आहे; तर Samanya Buddhimatta हा सर्वात कमकुवत भाग आहे, rank #10.

सुसंगतता

9.4

एकूण खर्च (सध्याची किंमत)

$0.016 ↓ -13.7%

या किमतीवर चाचणी केली: $0.019

एकूण आउटपुट टोकन्स

2,480

एकूण इनपुट टोकन्स

45,864

इनपुट किंमत

$0.260 / 1M

आउटपुट किंमत

$1.560 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 12

प्रति प्रयत्न पास दर: 46.0%

अस्थिर चाचण्या

2

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

2.31s

प्रतिसाद वेळ (कमाल): 6.65s

प्रतिसाद वेळ (एकूण): 34.63s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#106 Qwen3.5 Plus 2026-02-15

none
खर्च
$0.012
वेळ
153.2s
टोकन्स
7,787 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 13:10 नवीन चाचणी जोडली 6.3 10.0 $0.016 सध्याची रन
2026-05-21 23:45 सूट बदलला 6.4 10.0 $0.018 तुलना करा
2026-04-11 01:19 पहिली नोंदलेली रन 6.8 लागू नाही $0.017 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रनस्कोअरसुसंगतताविश्वसनीयताबरोबर चाचण्याअस्थिर चाचण्याएकूण आउटपुट टोकन्सएकूण इनपुट टोकन्सएकूण खर्चप्रतिसाद वेळ (सरासरी)
2026-06-04 13:10 · सध्याची रन5.89.410.09/2122,48045,864$0.0162.31s
2026-04-11 01:19 · पहिली नोंदलेली रन6.89.3लागू नाही9/1822,4610$0.0172.60s
फरक-0.9+0.100+19+45864-$0.001-294ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 15:40 $0.260 / 1M $1.560 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 4.8 10.0
कोडिंग 4.3 7.9
संयुक्त 3.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 5.3 10.0
Samanya Buddhimatta 4.4 3.0
सूचनांचे पालन 10.0 10.0
कोडी सोडवणे 7.7 10.0
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स