#78

Qwen3.5 Plus 2026-04-20

Qwen रिलीज़: 2026-04-20 परीक्षण किया गया: 2026-07-16 22:06 qwen/qwen3.5-plus-20260420::medium

(medium) (none)

सारांश

Qwen3.5 Plus 2026-04-20 AI BENCHY पर 7.2 स्कोर करता है और #78 पर है। इसकी reliability 9.6, pass rate 63.6%, कुल लागत $0.317, और औसत response time 46.36s है।

Qwen3.5 Plus 2026-04-20 को अलग क्या बनाता है: यह एंटी-एआई ट्रिक्स में सबसे अलग दिखता है, जहाँ इसकी रैंक #1 है; जबकि संयुक्त इसकी सबसे कमजोर जगह है, जहाँ यह #14 पर है।

स्कोर

7.2

संगति

9.0

विश्वसनीयता

9.6

कुल लागत (वर्तमान कीमत)

$0.317 ↓ -19.4%

परीक्षण के समय: $0.393

कुल आउटपुट टोकन

168,893

कुल इनपुट टोकन

42,097

इनपुट कीमत

$0.300 / 1M

आउटपुट कीमत

$1.800 / 1M

सही परीक्षण

गलत टेस्ट: 9

प्रति प्रयास पास दर: 63.6%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

46.36s

प्रतिक्रिया समय (अधिकतम): 189.38s

प्रतिक्रिया समय (कुल): 973.57s

गलत उत्तर: 8 समय समाप्त: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#78 Qwen3.5 Plus 2026-04-20

medium

लागत: $0.008
समय: 76.7s
टोकन: 4,355 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-07-16 22:06 नया टेस्ट जोड़ा गया	7.2	9.6	$0.317 ↓	वर्तमान रन
2026-06-04 13:15 नया टेस्ट जोड़ा गया	7.6	9.9	$0.317 ↓	तुलना करें
2026-05-21 23:53 सूट बदला गया	7.6	9.6	$0.363	तुलना करें
2026-05-08 14:34 सूट बदला गया	7.8	9.6	$0.305	तुलना करें
2026-05-08 14:34 सूट बदला गया	7.8	9.6	$0.305	तुलना करें
2026-04-27 23:09 पहला रन	8.2	9.7	$0.269	तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

रन तुलना

रन	स्कोर	संगति	विश्वसनीयता	सही परीक्षण	अस्थिर टेस्ट	कुल आउटपुट टोकन	कुल इनपुट टोकन	कुल लागत	प्रतिक्रिया समय (औसत)
2026-07-16 22:06 · वर्तमान रन	7.2	9.0	9.6	13/22	2	168,893	42,097	$0.317	46.36s
2026-05-21 23:53 · सूट बदला गया	7.6	8.7	9.6	13/20	3	152,480	0	$0.363	43.63s
अंतर	-0.4	+0.3	0.0	0	-1	+16413	+42097	-$0.046	+2730ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख	इनपुट कीमत	आउटपुट कीमत
2026-06-04 15:40	$0.300 / 1M	$1.800 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	10.0	10.0
कोडिंग	6.2	8.7
संयुक्त	6.5	10.0
डेटा पार्सिंग और निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	2.9	7.2
Samanya Buddhimatta	4.9	9.6
निर्देश पालन	10.0	10.0
पहेली समाधान	8.2	7.2
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

Qwen3.5 Plus 2026-04-20

Hamster playing table tennis

#78 Qwen3.5 Plus 2026-04-20

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल