नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Qwen: Qwen3.6 27B vs xAI: Grok 4.20

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-10

मेट्रिक Qwen3.6 27B Qwen3.6 27B none रिलीज़: 2026-04-20 Grok 4.20 Grok 4.20 none रिलीज़: 2026-03-31
स्कोर 5.8 5.4
रैंक #96 #115
विश्वसनीयता 10.0 लागू नहीं
संगति 7.3 9.5
सही परीक्षण
प्रति प्रयास पास दर 52.6% 35.2%
अस्थिर टेस्ट 6 1
कुल रन 57 54
प्रति परिणाम लागत 0.434 1.574
कुल लागत $0.031 $0.095
???? ??? $0.320 / 1M $1.250 / 1M
????? ??? $3.200 / 1M $2.500 / 1M
आउटपुट टोकन 3,786 1,967
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 4.00s 1.11s
प्रतिक्रिया समय (अधिकतम) 12.08s 6.04s
प्रतिक्रिया समय (कुल) 76.04s 20.02s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 27B 3.8 3.7 41.7% 3 2.83s 490 0
Grok 4.20 4.8 10.0 25.0% 0 501ms 267 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 27B 10.0 10.0 100.0% 0 10.18s 505 0
Grok 4.20 3.4 9.3 0.0% 0 1.22s 312 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 27B 3.0 10.0 0.0% 0 9.95s 1,401 0
Grok 4.20 3.0 10.0 0.0% 0 6.04s 282 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 27B 7.3 5.8 83.3% 1 2.06s 248 0
Grok 4.20 10.0 10.0 100.0% 0 522ms 207 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 27B 7.7 10.0 66.7% 0 3.03s 24 0
Grok 4.20 3.0 10.0 0.0% 0 687ms 325 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 27B 5.2 9.9 0.0% 0 1.07s 72 0
Grok 4.20 4.8 10.0 0.0% 0 659ms 83 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 27B 6.2 5.8 66.7% 1 1.92s 49 0
Grok 4.20 6.3 10.0 50.0% 0 455ms 60 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 27B 5.3 7.2 44.4% 1 5.24s 647 0
Grok 4.20 5.3 7.2 44.4% 1 487ms 242 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 27B 9.5 10.0 100.0% 0 6.74s 339 0
Grok 4.20 10.0 10.0 100.0% 0 4.63s 189 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 27B 3.0 10.0 0.0% 0 4.03s 11 0
Grok 4.20 - - - - - - - -

त्वरित तुलना

तुलना जोड़ी बदलें