AI BENCHY तुलना

Qwen3.6 Plus vs xAI: Grok 4.20

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-02

मेट्रिक	Qwen3.6 Plus Qwen3.6 Plus medium रिलीज़: 2026-04-02 निःशुल्क उपलब्ध	Grok 4.20 Grok 4.20 medium रिलीज़: 2026-03-31

मेट्रिक	Qwen3.6 Plus Qwen3.6 Plus medium रिलीज़: 2026-04-02 निःशुल्क उपलब्ध	Grok 4.20 Grok 4.20 medium रिलीज़: 2026-03-31
स्कोर	8.4	7.1
रैंक	#9	#40
संगति	9.5	8.2
सही परीक्षण
प्रति प्रयास पास दर	78.4%	66.7%
अस्थिर टेस्ट	1	4
कुल रन	51	51
प्रति परिणाम लागत	0.000	7.358
कुल लागत	$0.000	$0.663
???? ???	$0.000 / 1M	$2.000 / 1M
????? ???	$0.000 / 1M	$6.000 / 1M
आउटपुट टोकन	1,763	1,494
रीजनिंग टोकन	83,782	97,078
प्रतिक्रिया समय (औसत)	15.27s	9.50s
प्रतिक्रिया समय (अधिकतम)	43.55s	29.87s
प्रतिक्रिया समय (कुल)	259.55s	161.54s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.6 Plus	10.0	10.0	100.0%	0		9.90s	207	7,557
Grok 4.20	8.2	7.9	83.3%	1		3.36s	280	8,476

संयुक्त	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.6 Plus	10.0	10.0	100.0%	0		34.95s	452	13,073
Grok 4.20	10.0	10.0	100.0%	0		17.40s	232	9,556

डेटा पार्सिंग और निष्कर्षण	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.6 Plus	10.0	10.0	100.0%	0		14.95s	270	10,706
Grok 4.20	10.0	10.0	100.0%	0		4.17s	180	5,333

डोमेन-विशिष्ट	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.6 Plus	2.9	7.2	11.1%	1		29.59s	56	33,464
Grok 4.20	5.3	10.0	33.3%	0		27.03s	375	49,339

Samanya Buddhimatta	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.6 Plus	5.1	10.0	0.0%	0		27.05s	111	5,232
Grok 4.20	5.8	2.8	66.7%	1		7.09s	47	4,252

निर्देश पालन	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.6 Plus	10.0	10.0	100.0%	0		7.54s	102	5,552
Grok 4.20	7.3	5.9	83.3%	1		4.42s	40	5,474

Puzzle Solving	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.6 Plus	10.0	10.0	100.0%	0		6.11s	298	6,868
Grok 4.20	6.4	7.7	55.6%	1		3.89s	143	8,028

टूल कॉलिंग	स्कोर	संगति	प्रति प्रयास पास दर	अस्थिर टेस्ट	सही परीक्षण	प्रतिक्रिया समय (औसत)	आउटपुट टोकन	रीजनिंग टोकन
Qwen3.6 Plus	10.0	10.0	100.0%	0		5.87s	267	1,330
Grok 4.20	3.0	10.0	0.0%	0		13.68s	197	6,620

त्वरित तुलना

तुलना जोड़ी बदलें

Claude Sonnet 4.6nonevsGrok 4.20medium Gemini 3 Flash PreviewlowvsQwen3.6 Plusmediumनिःशुल्क उपलब्ध Qwen3.5 Plus 2026-02-15nonevsGrok 4.20medium Gemma 4 31BnonevsGrok 4.20medium Grok 4.20mediumvsGLM 5none Gemini 3.1 Flash Lite PreviewlowvsQwen3.6 Plusmediumनिःशुल्क उपलब्ध Gemini 3 Flash PreviewnonevsQwen3.6 Plusmediumनिःशुल्क उपलब्ध GPT-5.3 ChatnonevsGrok 4.20medium Gemini 3.1 Flash Lite PreviewnonevsQwen3.6 Plusmediumनिःशुल्क उपलब्ध GPT-5.2 ChatnonevsQwen3.6 Plusmediumनिःशुल्क उपलब्ध Grok 4.20mediumvsMiMo-V2-Omninone GPT-5.2 ChatnonevsGrok 4.20medium