नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Qwen: Qwen3.5-27B vs xAI: Grok 4.3

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-01

मेट्रिक Qwen3.5-27B Qwen3.5-27B medium रिलीज़: 2026-02-24 Grok 4.3 Grok 4.3 medium रिलीज़: 2026-05-01
स्कोर 8.4 8.2
रैंक #16 #20
विश्वसनीयता लागू नहीं 10.0
संगति 8.8 8.6
सही परीक्षण
प्रति प्रयास पास दर 81.5% 81.5%
अस्थिर टेस्ट 3 3
कुल रन 54 54
प्रति परिणाम लागत 3.822 3.974
कुल लागत $0.497 $0.517
???? ??? $0.195 / 1M $1.250 / 1M
????? ??? $1.560 / 1M $2.500 / 1M
आउटपुट टोकन 2,500 1,223
रीजनिंग टोकन 242,500 187,047
प्रतिक्रिया समय (औसत) 53.03s 48.63s
प्रतिक्रिया समय (अधिकतम) 163.96s 216.69s
प्रतिक्रिया समय (कुल) 954.46s 875.27s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 8.7 7.9 91.7% 1 19.75s 569 31,505
Grok 4.3 10.0 10.0 100.0% 0 8.83s 88 8,207
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 10.0 10.0 100.0% 0 70.35s 375 19,165
Grok 4.3 10.0 10.0 100.0% 0 45.72s 284 9,659
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 10.0 10.0 100.0% 0 163.96s 483 9,991
Grok 4.3 10.0 10.0 100.0% 0 63.99s 234 15,301
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 10.0 10.0 100.0% 0 30.26s 270 16,150
Grok 4.3 10.0 10.0 100.0% 0 18.97s 180 9,546
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 5.3 10.0 33.3% 0 79.53s 43 52,368
Grok 4.3 5.3 7.2 44.4% 1 181.74s 14 111,300
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 6.1 3.1 66.7% 1 101.41s 70 23,147
Grok 4.3 5.4 2.5 66.7% 1 24.70s 70 5,020
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 10.0 10.0 100.0% 0 19.66s 97 11,638
Grok 4.3 9.8 10.0 100.0% 0 18.58s 57 8,713
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 8.2 7.7 77.8% 1 64.61s 245 77,213
Grok 4.3 5.9 7.2 55.6% 1 22.53s 128 14,686
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 10.0 10.0 100.0% 0 7.45s 348 1,323
Grok 4.3 10.0 10.0 100.0% 0 17.66s 168 4,615

त्वरित तुलना

तुलना जोड़ी बदलें