AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com
#21

Qwen3.6 Plus

Qwen रिलीज़: 2026-04-20 परीक्षण किया गया: 2026-04-11 01:44 qwen/qwen3.6-plus::medium

सारांश

Qwen3.6 Plus AI BENCHY पर 8.1 स्कोर करता है और #21 पर है। इसकी reliability लागू नहीं, pass rate 74.1%, कुल लागत $0.000, और औसत response time 15.27s है।

Qwen3.6 Plus को अलग क्या बनाता है: यह एंटी-एआई ट्रिक्स में सबसे अलग दिखता है, जहाँ इसकी रैंक #1 है; जबकि कोडिंग इसकी सबसे कमजोर जगह है, जहाँ यह #17 पर है। इस score range के लिए इसकी कुल benchmark लागत असामान्य रूप से कम है।

पहचान नोट

Qwen3.6 Plus Preview, Qwen3.6 Plus का प्रीव्यू संस्करण था।

संगति

9.5

विश्वसनीयता

लागू नहीं

कुल आउटपुट टोकन

85,545

कुल इनपुट टोकन

0

इनपुट कीमत

$0.325 / 1M

आउटपुट कीमत

$1.950 / 1M

सही परीक्षण

गलत टेस्ट: 5

प्रति प्रयास पास दर: 74.1%

अस्थिर टेस्ट

1

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

15.27s

प्रतिक्रिया समय (अधिकतम): 43.55s

प्रतिक्रिया समय (कुल): 259.55s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#21 Qwen3.6 Plus

medium
लागत
$0.024
समय
219.0s
टोकन
12,235 tok

रन इतिहास

परीक्षण किया गया स्कोर विश्वसनीयता सही परीक्षण कुल लागत तुलना करें
2026-06-04 13:30 नया टेस्ट जोड़ा गया 7.9 10.0 $0.294 तुलना करें
2026-05-22 00:01 दोबारा परीक्षण 7.8 10.0 $0.082 तुलना करें
2026-04-11 01:44 पहला दर्ज रन 8.1 लागू नहीं $0.000 वर्तमान रन

रन तुलना

रनस्कोरसंगतिविश्वसनीयतासही परीक्षणअस्थिर टेस्टकुल आउटपुट टोकनकुल इनपुट टोकनकुल लागतप्रतिक्रिया समय (औसत)
2026-04-11 01:44 · पहला दर्ज रन8.19.5लागू नहीं13/18185,5450$0.00015.27s
2026-05-22 00:01 · दोबारा परीक्षण7.89.210.013/202126,7600$0.08226.78s
अंतर+0.4+0.30-1-412150-$0.082-11508ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

श्रेणी स्कोर संगति सही परीक्षण
एंटी-एआई ट्रिक्स 10.0 10.0
कोडिंग 3.0 10.0
संयुक्त 10.0 10.0
डेटा पार्सिंग और निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 2.9 7.2
Samanya Buddhimatta 5.1 10.0
निर्देश पालन 10.0 10.0
पहेली समाधान 10.0 10.0
टूल कॉलिंग 10.0 10.0

तुलना किए गए मॉडल