#78

Qwen3.5 Plus 2026-04-20

Qwen रिलीज़: 2026-04-20 परीक्षण किया गया: 2026-07-16 22:06 qwen/qwen3.5-plus-20260420::medium

(medium) (none)

सारांश

Qwen3.5 Plus 2026-04-20 AI BENCHY पर 7.2 स्कोर करता है और #78 पर है। इसकी reliability 9.6, pass rate 63.6%, कुल लागत $0.317, और औसत response time 46.36s है।

Qwen3.5 Plus 2026-04-20 को अलग क्या बनाता है: यह एंटी-एआई ट्रिक्स में सबसे अलग दिखता है, जहाँ इसकी रैंक #1 है; जबकि संयुक्त इसकी सबसे कमजोर जगह है, जहाँ यह #14 पर है।

स्कोर

7.2

संगति

9.0

विश्वसनीयता

9.6

कुल लागत (वर्तमान कीमत)

$0.317 ↓ -19.4%

परीक्षण के समय: $0.393

कुल आउटपुट टोकन

168,893

कुल इनपुट टोकन

42,097

इनपुट कीमत

$0.300 / 1M

आउटपुट कीमत

$1.800 / 1M

सही परीक्षण

गलत टेस्ट: 9

प्रति प्रयास पास दर: 63.6%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

46.36s

प्रतिक्रिया समय (अधिकतम): 189.38s

प्रतिक्रिया समय (कुल): 973.57s

गलत उत्तर: 8 समय समाप्त: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#78 Qwen3.5 Plus 2026-04-20

medium

लागत: $0.008
समय: 76.7s
टोकन: 4,355 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-07-16 22:06 नया टेस्ट जोड़ा गया	7.2	9.6	$0.317 ↓	वर्तमान रन
2026-06-04 13:15 नया टेस्ट जोड़ा गया	7.6	9.9	$0.317 ↓	तुलना करें
2026-05-21 23:53 सूट बदला गया	7.6	9.6	$0.363	तुलना करें
2026-05-08 14:34 सूट बदला गया	7.8	9.6	$0.305	तुलना करें
2026-05-08 14:34 सूट बदला गया	7.8	9.6	$0.305	तुलना करें
2026-04-27 23:09 पहला रन	8.2	9.7	$0.269	तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख	इनपुट कीमत	आउटपुट कीमत
2026-06-04 15:40	$0.300 / 1M	$1.800 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	10.0	10.0
कोडिंग	6.2	8.7
संयुक्त	6.5	10.0
डेटा पार्सिंग और निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	2.9	7.2
Samanya Buddhimatta	4.9	9.6
निर्देश पालन	10.0	10.0
पहेली समाधान	8.2	7.2
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

Qwen3.5 Plus 2026-04-20

Hamster playing table tennis

#78 Qwen3.5 Plus 2026-04-20

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल