AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com
#75

Qwen3.6 Max Preview

Qwen रिलीज़: 2026-04-20 परीक्षण किया गया: 2026-06-04 13:21 qwen/qwen3.6-max-preview::none
(medium) (none)

सारांश

Qwen3.6 Max Preview AI BENCHY पर 6.9 स्कोर करता है और #75 पर है। इसकी reliability 10.0, pass rate 58.7%, कुल लागत $0.075, और औसत response time 3.30s है।

Qwen3.6 Max Preview को अलग क्या बनाता है: यह डोमेन-विशिष्ट में सबसे अलग दिखता है, जहाँ इसकी रैंक #1 है; जबकि कोडिंग इसकी सबसे कमजोर जगह है, जहाँ यह #14 पर है। यह समान मॉडलों की तुलना में काफ़ी तेज है।

संगति

9.2

कुल लागत (वर्तमान कीमत)

$0.075 ↓ -18.3%

परीक्षण के समय: $0.091

कुल आउटपुट टोकन

4,779

कुल इनपुट टोकन

42,509

इनपुट कीमत

$1.040 / 1M

आउटपुट कीमत

$6.240 / 1M

सही परीक्षण

गलत टेस्ट: 10

प्रति प्रयास पास दर: 58.7%

अस्थिर टेस्ट

2

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

3.30s

प्रतिक्रिया समय (अधिकतम): 20.51s

प्रतिक्रिया समय (कुल): 69.40s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#75 Qwen3.6 Max Preview

none
Cost
$0.025
Time
83.9s
Tokens
4,066 tok

रन इतिहास

परीक्षण किया गया स्कोर विश्वसनीयता सही परीक्षण कुल लागत तुलना करें
2026-06-04 13:21 नया टेस्ट जोड़ा गया 6.9 10.0 $0.075 वर्तमान रन
2026-05-21 23:53 सूट बदला गया 7.1 10.0 $0.088 तुलना करें
2026-04-27 23:05 पहला रन 7.3 10.0 $0.083 तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख इनपुट कीमत आउटपुट कीमत
2026-06-04 15:40 $1.040 / 1M $6.240 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

श्रेणी स्कोर संगति सही परीक्षण
एंटी-एआई ट्रिक्स 5.2 7.9
कोडिंग 3.8 7.3
संयुक्त 3.0 10.0
डेटा पार्सिंग और निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 7.7 10.0
Samanya Buddhimatta 4.3 10.0
निर्देश पालन 9.8 10.0
पहेली समाधान 10.0 10.0
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना किए गए मॉडल