नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Qwen3.6 Plus Preview vs xAI: Grok 4.20

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-29

मेट्रिक Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium रिलीज़: 2026-04-20 निःशुल्क उपलब्ध Grok 4.20 Grok 4.20 medium रिलीज़: 2026-03-31
स्कोर 8.5 7.0
रैंक #14 #62
विश्वसनीयता लागू नहीं लागू नहीं
संगति 10.0 7.8
सही परीक्षण
प्रति प्रयास पास दर 76.5% 66.7%
अस्थिर टेस्ट 0 5
कुल रन 49 54
प्रति परिणाम लागत 0.000 8.252
कुल लागत $0.000 $0.743
???? ??? $0.000 / 1M $2.000 / 1M
????? ??? $0.000 / 1M $6.000 / 1M
आउटपुट टोकन 1,756 1,744
रीजनिंग टोकन 77,213 109,882
प्रतिक्रिया समय (औसत) 13.94s 10.33s
प्रतिक्रिया समय (अधिकतम) 43.55s 29.87s
प्रतिक्रिया समय (कुल) 237.01s 185.87s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 9.90s 207 7,557
Grok 4.20 8.2 7.9 83.3% 1 3.36s 280 8,476
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 34.95s 452 13,073
Grok 4.20 10.0 10.0 100.0% 0 17.40s 232 9,556
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 14.95s 270 10,706
Grok 4.20 10.0 10.0 100.0% 0 4.17s 180 5,333
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Plus Preview 3.0 10.0 0.0% 0 22.08s 49 26,895
Grok 4.20 5.3 10.0 33.3% 0 27.03s 375 49,339
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Plus Preview 5.1 10.0 0.0% 0 27.05s 111 5,232
Grok 4.20 5.8 2.8 66.7% 1 7.09s 47 4,252
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 7.54s 102 5,552
Grok 4.20 7.3 5.9 83.3% 1 4.42s 40 5,474
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 6.11s 298 6,868
Grok 4.20 6.4 7.7 55.6% 1 3.89s 143 8,028
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 5.87s 267 1,330
Grok 4.20 3.0 10.0 0.0% 0 13.68s 197 6,620
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Plus Preview - - - - - - - -
Grok 4.20 4.3 1.1 66.7% 1 24.33s 250 12,804

त्वरित तुलना

तुलना जोड़ी बदलें