नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Qwen: Qwen3.6 27B vs xAI: Grok 4.20

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-27

मेट्रिक Qwen3.6 27B Qwen3.6 27B medium रिलीज़: 2026-04-20 Grok 4.20 Grok 4.20 medium रिलीज़: 2026-03-31
स्कोर 7.0 7.0
रैंक #60 #61
विश्वसनीयता 10.0 लागू नहीं
संगति 7.9 7.8
सही परीक्षण
प्रति प्रयास पास दर 64.8% 66.7%
अस्थिर टेस्ट 5 5
कुल रन 54 54
प्रति परिणाम लागत 2.321 8.252
कुल लागत $0.209 $0.743
???? ??? $0.500 / 1M $2.000 / 1M
????? ??? $2.000 / 1M $6.000 / 1M
आउटपुट टोकन 8,279 1,744
रीजनिंग टोकन 91,083 109,882
प्रतिक्रिया समय (औसत) 50.53s 10.33s
प्रतिक्रिया समय (अधिकतम) 168.22s 29.87s
प्रतिक्रिया समय (कुल) 909.49s 185.87s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 27B 8.3 10.0 75.0% 0 12.62s 582 4,311
Grok 4.20 8.2 7.9 83.3% 1 3.36s 280 8,476
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 27B 10.0 10.0 100.0% 0 168.22s 433 17,861
Grok 4.20 4.3 1.1 66.7% 1 24.33s 250 12,804
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 27B 7.0 3.7 66.7% 1 83.07s 2,088 14,689
Grok 4.20 10.0 10.0 100.0% 0 17.40s 232 9,556
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 27B 3.5 1.4 50.0% 2 37.30s 568 9,404
Grok 4.20 10.0 10.0 100.0% 0 4.17s 180 5,333
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 27B 2.9 7.2 11.1% 1 73.38s 3,510 20,352
Grok 4.20 5.3 10.0 33.3% 0 27.03s 375 49,339
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 27B 6.5 3.4 66.7% 1 39.53s 81 3,045
Grok 4.20 5.8 2.8 66.7% 1 7.09s 47 4,252
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 27B 10.0 10.0 100.0% 0 37.96s 346 6,548
Grok 4.20 7.3 5.9 83.3% 1 4.42s 40 5,474
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 27B 7.7 10.0 66.7% 0 60.21s 281 11,919
Grok 4.20 6.4 7.7 55.6% 1 3.89s 143 8,028
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 27B 10.0 10.0 100.0% 0 16.88s 390 2,954
Grok 4.20 3.0 10.0 0.0% 0 13.68s 197 6,620

त्वरित तुलना

तुलना जोड़ी बदलें