AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com
#154

Qwen3.6 35B A3B

Qwen प्रकाशन: 2026-04-20 चाचणी तारीख: 2026-06-04 13:19 qwen/qwen3.6-35b-a3b::none
(medium) (none)

सारांश

Qwen3.6 35B A3B AI BENCHY वर 4.6 स्कोर करते आणि #154 वर आहे. याची reliability 10.0, pass rate 30.2%, एकूण खर्च $0.031, आणि सरासरी response time 3.73s आहे.

Qwen3.6 35B A3B खास का आहे: हे कोडिंग मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #1 आहे; तर टूल कॉलिंग हा सर्वात कमकुवत भाग आहे, rank #10.

सुसंगतता

8.0

एकूण खर्च (सध्याची किंमत)

$0.031 ↑ +1.0%

या किमतीवर चाचणी केली: $0.031

एकूण आउटपुट टोकन्स

27,755

एकूण इनपुट टोकन्स

19,329

इनपुट किंमत

$0.140 / 1M

आउटपुट किंमत

$1.000 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 17

प्रति प्रयत्न पास दर: 30.2%

अस्थिर चाचण्या

5

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

3.73s

प्रतिसाद वेळ (कमाल): 22.52s

प्रतिसाद वेळ (एकूण): 70.86s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#154 Qwen3.6 35B A3B

none
Cost
$0.008
Time
30.1s
Tokens
6,317 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 13:19 नवीन चाचणी जोडली 4.6 10.0 $0.031 सध्याची रन
2026-05-21 23:54 सूट बदलला 4.9 10.0 $0.030 तुलना करा
2026-04-27 23:05 पहिला रन 5.1 10.0 $0.019 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रनस्कोअरसुसंगतताविश्वसनीयताबरोबर चाचण्याअस्थिर चाचण्याएकूण आउटपुट टोकन्सएकूण इनपुट टोकन्सएकूण खर्चप्रतिसाद वेळ (सरासरी)
2026-06-04 13:19 · सध्याची रन4.68.010.04/21527,75519,329$0.0313.73s
2026-05-21 23:54 · सूट बदलला4.97.710.04/18527,7470$0.0303.83s
फरक-0.3+0.30.0-20+8+19329+$0.001-100ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 15:40 $0.140 / 1M $1.000 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 3.6 7.6
कोडिंग 5.5 10.0
संयुक्त 3.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 3.5 4.4
Samanya Buddhimatta 4.4 3.0
सूचनांचे पालन 6.2 5.8
कोडी सोडवणे 3.2 9.9
टूल कॉलिंग 3.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स