नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Qwen: Qwen3.6 Max Preview vs xAI: Grok 4.3

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-07

मेट्रिक Qwen3.6 Max Preview Qwen3.6 Max Preview medium रिलीज़: 2026-04-20 Grok 4.3 Grok 4.3 medium रिलीज़: 2026-05-01
स्कोर 8.8 8.2
रैंक #8 #21
विश्वसनीयता 10.0 10.0
संगति 9.5 8.6
सही परीक्षण
प्रति प्रयास पास दर 85.2% 81.5%
अस्थिर टेस्ट 1 3
कुल रन 54 54
प्रति परिणाम लागत 5.486 3.974
कुल लागत $0.823 $0.517
???? ??? $1.040 / 1M $1.250 / 1M
????? ??? $6.240 / 1M $2.500 / 1M
आउटपुट टोकन 2,158 1,223
रीजनिंग टोकन 97,495 187,047
प्रतिक्रिया समय (औसत) 48.31s 48.63s
प्रतिक्रिया समय (अधिकतम) 186.74s 216.69s
प्रतिक्रिया समय (कुल) 869.64s 875.27s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 22.13s 228 10,075
Grok 4.3 10.0 10.0 100.0% 0 8.83s 88 8,207
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 117.87s 368 13,790
Grok 4.3 10.0 10.0 100.0% 0 45.72s 284 9,659
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 121.49s 390 14,575
Grok 4.3 10.0 10.0 100.0% 0 63.99s 234 15,301
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 41.15s 270 10,106
Grok 4.3 10.0 10.0 100.0% 0 18.97s 180 9,546
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Max Preview 2.9 7.2 11.1% 1 95.91s 60 30,371
Grok 4.3 5.3 7.2 44.4% 1 181.74s 14 111,300
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 32.24s 129 3,510
Grok 4.3 5.4 2.5 66.7% 1 24.70s 70 5,020
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 24.31s 103 5,848
Grok 4.3 9.8 10.0 100.0% 0 18.58s 57 8,713
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 24.19s 301 7,649
Grok 4.3 5.9 7.2 55.6% 1 22.53s 128 14,686
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 18.32s 309 1,571
Grok 4.3 10.0 10.0 100.0% 0 17.66s 168 4,615

त्वरित तुलना

तुलना जोड़ी बदलें