Qwen3.7 Plus vs Grok 4.20 (medium)

क्रमांक: #79
एकूण आउटपुट टोकन्स: 58,097
प्रतिसाद वेळ (सरासरी): 12.09s
एकूण खर्च: $0.106

क्रमांक: #83
एकूण आउटपुट टोकन्स: 259,340
प्रतिसाद वेळ (सरासरी): 29.47s
एकूण खर्च: $0.777

शिफारस केलेले मॉडेल Qwen3.7 Plus

It has the best score here (7.2), while costing about 7.3x less than Grok 4.20 (medium).

तपशीलवार तुलना

मेट्रिक	Qwen3.7 Plus Qwen3.7 Plus none प्रकाशन: 2026-06-03	Grok 4.20 Grok 4.20 medium प्रकाशन: 2026-03-31

मेट्रिक	Qwen3.7 Plus Qwen3.7 Plus none प्रकाशन: 2026-06-03	Grok 4.20 Grok 4.20 medium प्रकाशन: 2026-03-31
स्कोअर	7.2	7.1
क्रमांक	#79	#83
विश्वसनीयता	10.0	10.0
सुसंगतता	10.0	8.5
बरोबर चाचण्या
प्रति प्रयत्न पास दर	50.0%	63.6%
अस्थिर चाचण्या	0	4
एकूण रन	66	66
प्रति निकाल खर्च	1.014	9.709
एकूण खर्च	$0.106	$0.777
इनपुट किंमत	$0.320 / 1M	$1.250 / 1M
आउटपुट किंमत	$1.280 / 1M	$2.500 / 1M
एकूण इनपुट टोकन्स	98,824	102,791
आउटपुट टोकन्स	58,097	5,363
रिझनिंग टोकन्स	0	253,977
प्रतिसाद वेळ (सरासरी)	12.09s	29.47s
प्रतिसाद वेळ (कमाल)	206.03s	199.66s
प्रतिसाद वेळ (एकूण)	265.89s	648.35s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#79 Qwen3.7 Plus

none

खर्च: $0.019
वेळ: 213.5s
टोकन्स: 11,960 tok

#83 xAI: Grok 4.20

medium

खर्च: $0.041
वेळ: 110.3s
टोकन्स: 16,336 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

श्रेणी:

अँटी-एआय युक्त्या	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	इनपुट टोकन्स	आउटपुट टोकन्स	रिझनिंग टोकन्स
Qwen3.7 Plus	6.5	10.0	50.0%	0		1.38s	696	349	0
Grok 4.20	8.2	7.9	83.3%	1		3.95s	2,010	287	8,312

कोडिंग	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	इनपुट टोकन्स	आउटपुट टोकन्स	रिझनिंग टोकन्स
Qwen3.7 Plus	5.5	10.0	33.3%	0		2.15s	7,911	639	0
Grok 4.20	6.3	6.6	55.6%	1		109.93s	8,307	268	103,150

संयुक्त	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	इनपुट टोकन्स	आउटपुट टोकन्स	रिझनिंग टोकन्स
Qwen3.7 Plus	10.0	10.0	100.0%	0		117.70s	71,266	56,024	0
Grok 4.20	8.7	6.9	83.3%	1		42.25s	71,267	3,776	44,009

डेटा पार्सिंग आणि निष्कर्षण	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	इनपुट टोकन्स	आउटपुट टोकन्स	रिझनिंग टोकन्स
Qwen3.7 Plus	10.0	10.0	100.0%	0		1.43s	7,794	243	0
Grok 4.20	10.0	10.0	100.0%	0		4.17s	7,761	180	5,333

डोमेन-विशिष्ट	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	इनपुट टोकन्स	आउटपुट टोकन्स	रिझनिंग टोकन्स
Qwen3.7 Plus	3.0	10.0	0.0%	0		868ms	789	18	0
Grok 4.20	5.3	10.0	33.3%	0		27.03s	1,764	375	49,339

Samanya Buddhimatta	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	इनपुट टोकन्स	आउटपुट टोकन्स	रिझनिंग टोकन्स
Qwen3.7 Plus	5.3	10.0	0.0%	0		1.33s	522	78	0
Grok 4.20	3.9	2.6	33.3%	1		24.48s	825	65	6,440

सूचनांचे पालन	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	इनपुट टोकन्स	आउटपुट टोकन्स	रिझनिंग टोकन्स
Qwen3.7 Plus	6.3	10.0	50.0%	0		929ms	711	72	0
Grok 4.20	9.8	10.0	100.0%	0		4.26s	1,362	57	6,419

कोडी सोडवणे	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	इनपुट टोकन्स	आउटपुट टोकन्स	रिझनिंग टोकन्स
Qwen3.7 Plus	7.7	10.0	66.7%	0		1.71s	714	443	0
Grok 4.20	7.7	10.0	66.7%	0		6.22s	1,689	149	7,913

टूल कॉलिंग	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	इनपुट टोकन्स	आउटपुट टोकन्स	रिझनिंग टोकन्स
Qwen3.7 Plus	10.0	10.0	100.0%	0		3.54s	8,211	222	0
Grok 4.20	3.0	10.0	0.0%	0		13.68s	7,275	197	6,620

सामान्य ज्ञान	स्कोअर	सुसंगतता	प्रति प्रयत्न पास दर	अस्थिर चाचण्या	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)	इनपुट टोकन्स	आउटपुट टोकन्स	रिझनिंग टोकन्स
Qwen3.7 Plus	3.0	10.0	0.0%	0		1.21s	210	9	0
Grok 4.20	3.0	10.0	0.0%	0		63.48s	531	9	16,442

झटपट तुलना

तुलना जोडी बदला

Qwen3.7 PlusnonevsGrok 4.3medium Qwen3.7 PlusnonevsGLM 5.1medium KAT-Coder-Pro V2.5highvsQwen3.7 Plusnone Kimi K2.6mediumvsQwen3.7 Plusnone Qwen3.7 PlusnonevsStep 3.7 Flashlow KAT-Coder-Pro V2.5highvsGrok 4.20medium Gemini 3.5 FlashnonevsGrok 4.20medium Step 3.7 FlashlowvsGrok 4.20medium Gemini 3.1 Flash LitemediumvsQwen3.7 Plusnone Claude Opus 4.8nonevsGrok 4.20medium DeepSeek V3.2mediumvsQwen3.7 Plusnone Gemini 3.1 Flash Lite PreviewmediumvsQwen3.7 Plusnone