Qwen3.7 Plus vs Grok 4.20 (medium)

रैंक: #81
कुल आउटपुट टोकन: 58,097
प्रतिक्रिया समय (औसत): 12.09s
कुल लागत: $0.106

रैंक: #85
कुल आउटपुट टोकन: 259,340
प्रतिक्रिया समय (औसत): 29.47s
कुल लागत: $0.777

अनुशंसित मॉडल Qwen3.7 Plus

It has the best score here (7.2), while costing about 7.3x less than Grok 4.20 (medium).

विस्तृत तुलना

मेट्रिक	Qwen3.7 Plus Qwen3.7 Plus none रिलीज़: 2026-06-03	Grok 4.20 Grok 4.20 medium रिलीज़: 2026-03-31

मेट्रिक	Qwen3.7 Plus Qwen3.7 Plus none रिलीज़: 2026-06-03	Grok 4.20 Grok 4.20 medium रिलीज़: 2026-03-31
स्कोर	7.2	7.1
रैंक	#81	#85
विश्वसनीयता	10.0	10.0
संगति	10.0	8.5
सही परीक्षण
प्रति प्रयास पास दर	50.0%	63.6%
अस्थिर टेस्ट	0	4
कुल रन	66	66
प्रति परिणाम लागत	1.014	9.709
कुल लागत	$0.106	$0.777
इनपुट कीमत	$0.320 / 1M	$1.250 / 1M
आउटपुट कीमत	$1.280 / 1M	$2.500 / 1M
कुल इनपुट टोकन	98,824	102,791
आउटपुट टोकन	58,097	5,363
रीजनिंग टोकन	0	253,977
प्रतिक्रिया समय (औसत)	12.09s	29.47s
प्रतिक्रिया समय (अधिकतम)	206.03s	199.66s
प्रतिक्रिया समय (कुल)	265.89s	648.35s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#81 Qwen3.7 Plus

none

लागत: $0.019
समय: 213.5s
टोकन: 11,960 tok

#85 xAI: Grok 4.20

medium

लागत: $0.041
समय: 110.3s
टोकन: 16,336 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

श्रेणी:

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.7 Plus	6.5	10.0	50.0%	0		1.38s	696	349	0
Grok 4.20	8.2	7.9	83.3%	1		3.95s	2,010	287	8,312

कोडिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.7 Plus	5.5	10.0	33.3%	0		2.15s	7,911	639	0
Grok 4.20	6.3	6.6	55.6%	1		109.93s	8,307	268	103,150

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.7 Plus	10.0	10.0	100.0%	0		117.70s	71,266	56,024	0
Grok 4.20	8.7	6.9	83.3%	1		42.25s	71,267	3,776	44,009

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.7 Plus	10.0	10.0	100.0%	0		1.43s	7,794	243	0
Grok 4.20	10.0	10.0	100.0%	0		4.17s	7,761	180	5,333

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.7 Plus	3.0	10.0	0.0%	0		868ms	789	18	0
Grok 4.20	5.3	10.0	33.3%	0		27.03s	1,764	375	49,339

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.7 Plus	5.3	10.0	0.0%	0		1.33s	522	78	0
Grok 4.20	3.9	2.6	33.3%	1		24.48s	825	65	6,440

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.7 Plus	6.3	10.0	50.0%	0		929ms	711	72	0
Grok 4.20	9.8	10.0	100.0%	0		4.26s	1,362	57	6,419

पहेली समाधान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.7 Plus	7.7	10.0	66.7%	0		1.71s	714	443	0
Grok 4.20	7.7	10.0	66.7%	0		6.22s	1,689	149	7,913

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.7 Plus	10.0	10.0	100.0%	0		3.54s	8,211	222	0
Grok 4.20	3.0	10.0	0.0%	0		13.68s	7,275	197	6,620

सामान्य ज्ञान	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	इनपुट टोकन	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.7 Plus	3.0	10.0	0.0%	0		1.21s	210	9	0
Grok 4.20	3.0	10.0	0.0%	0		63.48s	531	9	16,442

त्वरित तुलना

तुलना जोड़ी बदलें

Qwen3.7 PlusnonevsGrok 4.3medium Qwen3.7 PlusnonevsGLM 5.1medium KAT-Coder-Pro V2.5highvsQwen3.7 Plusnone Kimi K2.6mediumvsQwen3.7 Plusnone Qwen3.7 PlusnonevsStep 3.7 Flashlow KAT-Coder-Pro V2.5highvsGrok 4.20medium Gemini 3.5 FlashnonevsGrok 4.20medium Step 3.7 FlashlowvsGrok 4.20medium Gemini 3.1 Flash LitemediumvsQwen3.7 Plusnone Claude Opus 4.8nonevsGrok 4.20medium DeepSeek V3.2mediumvsQwen3.7 Plusnone Gemini 3.1 Flash Lite PreviewmediumvsQwen3.7 Plusnone