AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com
#129

Qwen3.6 Flash

Qwen प्रकाशन: 2026-04-20 चाचणी तारीख: 2026-06-04 13:17 qwen/qwen3.6-flash::none
(medium) (none)

सारांश

Qwen3.6 Flash AI BENCHY वर 5.4 स्कोर करते आणि #129 वर आहे. याची reliability 10.0, pass rate 33.3%, एकूण खर्च $0.015, आणि सरासरी response time 1.60s आहे.

Qwen3.6 Flash खास का आहे: हे Samanya Buddhimatta मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #1 आहे; तर अँटी-एआय युक्त्या हा सर्वात कमकुवत भाग आहे, rank #13.

सुसंगतता

10.0

एकूण खर्च (सध्याची किंमत)

$0.015 ↓ -23.5%

या किमतीवर चाचणी केली: $0.019

एकूण आउटपुट टोकन्स

4,164

एकूण इनपुट टोकन्स

50,810

इनपुट किंमत

$0.188 / 1M

आउटपुट किंमत

$1.125 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 14

प्रति प्रयत्न पास दर: 33.3%

अस्थिर चाचण्या

0

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

1.60s

प्रतिसाद वेळ (कमाल): 4.60s

प्रतिसाद वेळ (एकूण): 33.59s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#129 Qwen3.6 Flash

none
Cost
$0.005
Time
20.1s
Tokens
4,211 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 13:17 नवीन चाचणी जोडली 5.4 10.0 $0.015 सध्याची रन
2026-05-21 23:50 सूट बदलला 5.5 9.7 $0.019 तुलना करा
2026-04-27 23:05 पहिला रन 5.8 10.0 $0.018 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रनस्कोअरसुसंगतताविश्वसनीयताबरोबर चाचण्याअस्थिर चाचण्याएकूण आउटपुट टोकन्सएकूण इनपुट टोकन्सएकूण खर्चप्रतिसाद वेळ (सरासरी)
2026-06-04 13:17 · सध्याची रन5.410.010.07/2104,16450,810$0.0151.60s
2026-04-27 23:05 · पहिला रन5.810.010.07/1804,1610$0.0181.65s
फरक-0.40.00.000+3+50810-$0.004-55ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 15:40 $0.188 / 1M $1.125 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 3.1 10.0
कोडिंग 5.4 10.0
संयुक्त 3.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 5.3 10.0
Samanya Buddhimatta 10.0 10.0
सूचनांचे पालन 6.3 10.0
कोडी सोडवणे 3.5 10.0
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स