AI BENCHY
Advertise here
#37

Qwen3.5 Plus 2026-04-20

Qwen रिलीज़: 2026-04-20 परीक्षण किया गया: 2026-06-04 13:15 qwen/qwen3.5-plus-20260420::medium
(medium) (none)

सारांश

Qwen3.5 Plus 2026-04-20 AI BENCHY पर 7.6 स्कोर करता है और #37 पर है। इसकी reliability 10.0, pass rate 66.7%, कुल लागत $0.317, और औसत response time 46.36s है।

संगति

9.0

कुल लागत (वर्तमान कीमत)

$0.317 ↓ -19.4%

परीक्षण के समय: $0.393

कुल आउटपुट टोकन

168,893

कुल इनपुट टोकन

42,097

इनपुट कीमत

$0.300 / 1M

आउटपुट कीमत

$1.800 / 1M

सही परीक्षण

गलत टेस्ट: 8

प्रति प्रयास पास दर: 66.7%

अस्थिर टेस्ट

2

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

46.36s

प्रतिक्रिया समय (अधिकतम): 189.38s

प्रतिक्रिया समय (कुल): 973.57s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#37 Qwen3.5 Plus 2026-04-20

medium
Cost
$0.008
Time
76.7s
Tokens
4,355 tok

रन इतिहास

परीक्षण किया गया स्कोर विश्वसनीयता सही परीक्षण कुल लागत तुलना करें
2026-06-04 13:15 नया टेस्ट जोड़ा गया 7.6 9.9 $0.317 वर्तमान रन
2026-05-21 23:53 सूट बदला गया 7.6 9.6 $0.363 तुलना करें
2026-05-08 14:34 सूट बदला गया 7.8 9.6 $0.305 तुलना करें
2026-05-08 14:34 सूट बदला गया 7.8 9.6 $0.305 तुलना करें
2026-04-27 23:09 पहला रन 8.2 9.7 $0.269 तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

रन तुलना

रनस्कोरसंगतिविश्वसनीयतासही परीक्षणअस्थिर टेस्टकुल आउटपुट टोकनकुल इनपुट टोकनकुल लागतप्रतिक्रिया समय (औसत)
2026-06-04 13:15 · वर्तमान रन7.69.010.013/212168,89342,097$0.31746.36s
2026-05-21 23:53 · सूट बदला गया7.68.79.613/203152,4800$0.36343.63s
अंतर0.0+0.3+0.40-1+16413+42097-$0.046+2730ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख इनपुट कीमत आउटपुट कीमत
2026-06-04 15:40 $0.300 / 1M $1.800 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

श्रेणी स्कोर संगति सही परीक्षण
एंटी-एआई ट्रिक्स 10.0 10.0
कोडिंग 6.2 8.7
संयुक्त 10.0 10.0
डेटा पार्सिंग और निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 2.9 7.2
Samanya Buddhimatta 4.9 9.6
निर्देश पालन 10.0 10.0
पहेली समाधान 8.2 7.2
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना किए गए मॉडल