#25

Qwen3.6 Flash

Qwen प्रकाशन: 2026-04-20 चाचणी तारीख: 2026-04-27 23:06 qwen/qwen3.6-flash::medium

(medium) (none)

सारांश

Qwen3.6 Flash AI BENCHY वर 8.1 स्कोर करते आणि #25 वर आहे. याची reliability 10.0, pass rate 79.6%, एकूण खर्च $0.174, आणि सरासरी response time 9.90s आहे.

Qwen3.6 Flash खास का आहे: या score range साठी एकूण benchmark खर्च असामान्यपणे कमी आहे.

स्कोअर

8.1

सुसंगतता

8.2

विश्वसनीयता

10.0

एकूण खर्च (सध्याची किंमत)

$0.174

एकूण आउटपुट टोकन्स

110,014

एकूण इनपुट टोकन्स

इनपुट किंमत

$0.250 / 1M

आउटपुट किंमत

$1.500 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 6

प्रति प्रयत्न पास दर: 79.6%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

9.90s

प्रतिसाद वेळ (कमाल): 26.85s

प्रतिसाद वेळ (एकूण): 178.26s

चुकीचे उत्तर: 5 सूचनांचे पालन केले नाही: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#25 Qwen3.6 Flash

medium

अवैध SVG

खर्च: $0.008
वेळ: 29.9s
टोकन्स: 6,784 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-07-16 21:53 नवीन चाचणी जोडली	6.9	10.0	$0.738 ↓	तुलना करा
2026-06-04 13:18 नवीन चाचणी जोडली	7.5	10.0	$0.288 ↓	तुलना करा
2026-05-21 23:53 सूट बदलला	7.4	9.7	$0.348	तुलना करा
2026-04-27 23:06 पहिला रन	8.1	10.0	$0.174	सध्याची रन

रन तुलना

रन	स्कोअर	सुसंगतता	विश्वसनीयता	बरोबर चाचण्या	अस्थिर चाचण्या	एकूण आउटपुट टोकन्स	एकूण इनपुट टोकन्स	एकूण खर्च	प्रतिसाद वेळ (सरासरी)
2026-04-27 23:06 · पहिला रन	8.1	8.2	10.0	12/18	4	110,014	0	$0.174	9.90s
2026-06-04 13:18 · नवीन चाचणी जोडली	7.5	8.1	10.0	12/21	5	248,353	42,362	$0.288	19.25s
फरक	+0.6	+0.1	0.0	0	-1	-138339	-42362	-$0.114	-9344ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

Qwen3.6 FlashmediumvsMiMo-V2.5-Promedium Qwen3.6 FlashmediumvsStep 3.7 Flashhigh Qwen3.6 FlashmediumvsGPT-5.6 Solnone Qwen3.6 FlashmediumvsGPT-5.5none Qwen3.6 FlashmediumvsDeepSeek V4 Pronone Qwen3.6 FlashmediumvsGemini 3.5 Flashminimal Qwen3.6 FlashmediumvsKAT-Coder-Pro V2.5medium Qwen3.6 FlashmediumvsGemini 3 Flash Previewnone Qwen3.6 FlashmediumvsSeed-2.0-Minimedium Qwen3.6 FlashmediumvsQwen3.6 35B A3Bmedium

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	10.0	10.0
कोडिंग	6.7	3.5
संयुक्त	10.0	10.0
डेटा पार्सिंग आणि निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	3.5	4.4
Samanya Buddhimatta	4.8	9.9
सूचनांचे पालन	10.0	10.0
कोडी सोडवणे	8.2	7.2
टूल कॉलिंग	10.0	10.0

Qwen3.6 Flash

Hamster playing table tennis

#25 Qwen3.6 Flash

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स