Qwen3.7 Max

Qwen रिलीज़: 2026-05-22 परीक्षण किया गया: 2026-06-04 13:24 qwen/qwen3.7-max::medium

(medium) (none)

सारांश

Qwen3.7 Max AI BENCHY पर 9.4 स्कोर करता है और #3 पर है। इसकी reliability 10.0, pass rate 88.9%, कुल लागत $0.523, और औसत response time 16.02s है।

Qwen3.7 Max को अलग क्या बनाता है: यह कुल मिलाकर सबसे ऊँची रैंक वाले मॉडलों में से एक है। इस score range के लिए इसकी कुल benchmark लागत असामान्य रूप से कम है।

स्कोर

9.4

संगति

9.6

विश्वसनीयता

10.0

कुल लागत (वर्तमान कीमत)

$0.523 ↓ -47.4%

परीक्षण के समय: $0.993

कुल आउटपुट टोकन

125,088

कुल इनपुट टोकन

42,360

इनपुट कीमत

$1.250 / 1M

आउटपुट कीमत

$3.750 / 1M

सही परीक्षण

गलत टेस्ट: 3

प्रति प्रयास पास दर: 88.9%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

16.02s

प्रतिक्रिया समय (अधिकतम): 59.98s

प्रतिक्रिया समय (कुल): 336.51s

गलत उत्तर: 3

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#3 Qwen3.7 Max

medium

लागत: $0.017
समय: 68.8s
टोकन: 4,526 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	सही परीक्षण	कुल लागत	तुलना करें
2026-06-04 13:24 नया टेस्ट जोड़ा गया	9.1	10.0		$0.523 ↓	वर्तमान रन
2026-05-21 23:55 पहला रन	9.0	10.0		$0.942	तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख	इनपुट कीमत	आउटपुट कीमत
2026-06-04 15:40	$1.250 / 1M	$3.750 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

Qwen3.7 MaxmediumvsGemini 3 Flash Previewmedium Qwen3.7 MaxmediumvsGPT-5.5low Qwen3.7 MaxmediumvsGemini 3.5 Flashhigh Qwen3.7 MaxmediumvsGemini 3.5 Flashlow Qwen3.7 MaxmediumvsClaude Fable 5medium Qwen3.7 MaxmediumvsNemotron 3 Ultra 550b A55bmediumनिःशुल्क उपलब्ध

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	10.0	10.0
कोडिंग	10.0	10.0
संयुक्त	10.0	10.0
डेटा पार्सिंग और निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	5.9	7.2
Samanya Buddhimatta	10.0	10.0
निर्देश पालन	10.0	10.0
पहेली समाधान	10.0	10.0
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

Qwen3.7 Max

Hamster playing table tennis

#3 Qwen3.7 Max

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल