नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Qwen: Qwen3.6 Max Preview vs xAI: Grok 4.20

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-27

मेट्रिक Qwen3.6 Max Preview Qwen3.6 Max Preview none रिलीज़: 2026-04-20 Grok 4.20 Grok 4.20 medium रिलीज़: 2026-03-31
स्कोर 7.3 7.0
रैंक #56 #61
विश्वसनीयता 10.0 लागू नहीं
संगति 8.7 7.8
सही परीक्षण
प्रति प्रयास पास दर 66.7% 66.7%
अस्थिर टेस्ट 3 5
कुल रन 54 54
प्रति परिणाम लागत 0.827 8.252
कुल लागत $0.083 $0.743
???? ??? $1.300 / 1M $2.000 / 1M
????? ??? $7.800 / 1M $6.000 / 1M
आउटपुट टोकन 4,732 1,744
रीजनिंग टोकन 0 109,882
प्रतिक्रिया समय (औसत) 3.38s 10.33s
प्रतिक्रिया समय (अधिकतम) 20.51s 29.87s
प्रतिक्रिया समय (कुल) 60.83s 185.87s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Max Preview 5.2 7.9 41.7% 1 2.63s 513 0
Grok 4.20 8.2 7.9 83.3% 1 3.36s 280 8,476
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Max Preview 5.0 2.0 66.7% 1 3.45s 426 0
Grok 4.20 4.3 1.1 66.7% 1 24.33s 250 12,804
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 20.51s 2,842 0
Grok 4.20 10.0 10.0 100.0% 0 17.40s 232 9,556
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.87s 243 0
Grok 4.20 10.0 10.0 100.0% 0 4.17s 180 5,333
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Max Preview 7.7 10.0 66.7% 0 1.22s 18 0
Grok 4.20 5.3 10.0 33.3% 0 27.03s 375 49,339
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Max Preview 4.3 10.0 0.0% 0 1.62s 76 0
Grok 4.20 5.8 2.8 66.7% 1 7.09s 47 4,252
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Max Preview 8.4 6.9 83.3% 1 1.45s 69 0
Grok 4.20 7.3 5.9 83.3% 1 4.42s 40 5,474
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.38s 323 0
Grok 4.20 6.4 7.7 55.6% 1 3.89s 143 8,028
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 5.27s 222 0
Grok 4.20 3.0 10.0 0.0% 0 13.68s 197 6,620

त्वरित तुलना

तुलना जोड़ी बदलें