Qwen3.7 Max

Qwen रिलीज़: 2026-05-22 परीक्षण किया गया: 2026-05-21 23:55 qwen/qwen3.7-max::medium

(medium) (none)

सारांश

Qwen3.7 Max AI BENCHY पर 9.0 स्कोर करता है और #5 पर है। इसकी reliability 10.0, pass rate 88.3%, कुल लागत $0.942, और औसत response time 13.83s है।

Qwen3.7 Max को अलग क्या बनाता है: यह कुल मिलाकर सबसे ऊँची रैंक वाले मॉडलों में से एक है।

स्कोर

9.0

संगति

9.6

विश्वसनीयता

10.0

कुल लागत (वर्तमान कीमत)

$0.942

कुल आउटपुट टोकन

112,394

कुल इनपुट टोकन

इनपुट कीमत

$2.500 / 1M

आउटपुट कीमत

$7.500 / 1M

सही परीक्षण

गलत टेस्ट: 3

प्रति प्रयास पास दर: 88.3%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

13.83s

प्रतिक्रिया समय (अधिकतम): 33.37s

प्रतिक्रिया समय (कुल): 276.53s

गलत उत्तर: 3

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#5 Qwen3.7 Max

medium

लागत: $0.017
समय: 68.8s
टोकन: 4,526 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	सही परीक्षण	कुल लागत	तुलना करें
2026-06-04 13:24 नया टेस्ट जोड़ा गया	9.1	10.0		$0.523 ↓	तुलना करें
2026-05-21 23:55 पहला रन	9.0	10.0		$0.942	वर्तमान रन

रन तुलना

रन	स्कोर	संगति	विश्वसनीयता	सही परीक्षण	अस्थिर टेस्ट	कुल आउटपुट टोकन	कुल इनपुट टोकन	कुल लागत	प्रतिक्रिया समय (औसत)
2026-05-21 23:55 · पहला रन	9.0	9.6	10.0	17/20	1	112,394	0	$0.942	13.83s
2026-06-04 13:24 · नया टेस्ट जोड़ा गया	9.1	9.6	10.0	18/21	1	125,088	42,360	$0.523	16.02s
अंतर	-0.1	0.0	0.0	-1	0	-12694	-42360	+$0.420	-2198ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

Qwen3.7 MaxmediumvsGemini 3 Flash Previewmedium Qwen3.7 MaxmediumvsGPT-5.5low Qwen3.7 MaxmediumvsGemini 3.5 Flashhigh Qwen3.7 MaxmediumvsGemini 3.5 Flashlow Qwen3.7 MaxmediumvsClaude Fable 5medium Qwen3.7 MaxmediumvsNemotron 3 Ultra 550b A55bmediumनिःशुल्क उपलब्ध

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	10.0	10.0
कोडिंग	10.0	10.0
संयुक्त	10.0	10.0
डेटा पार्सिंग और निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	5.9	7.2
Samanya Buddhimatta	10.0	10.0
निर्देश पालन	10.0	10.0
पहेली समाधान	10.0	10.0
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

Qwen3.7 Max

Hamster playing table tennis

#5 Qwen3.7 Max

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल