नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Qwen: Qwen3.5-27B vs xAI: Grok 4.20

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-14

मेट्रिक Qwen3.5-27B Qwen3.5-27B none रिलीज़: 2026-02-24 Grok 4.20 Grok 4.20 medium रिलीज़: 2026-03-31
स्कोर 5.9 7.0
रैंक #64 #44
संगति 9.2 7.8
सही परीक्षण
प्रति प्रयास पास दर 38.9% 66.7%
अस्थिर टेस्ट 2 5
कुल रन 54 54
प्रति परिणाम लागत 0.265 8.252
कुल लागत $0.016 $0.743
???? ??? $0.195 / 1M $2.000 / 1M
????? ??? $1.560 / 1M $6.000 / 1M
आउटपुट टोकन 3,545 1,744
रीजनिंग टोकन 0 109,882
प्रतिक्रिया समय (औसत) 1.74s 10.33s
प्रतिक्रिया समय (अधिकतम) 9.39s 29.87s
प्रतिक्रिया समय (कुल) 31.32s 185.87s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 4.8 10.0 25.0% 0 788ms 267 0
Grok 4.20 8.2 7.9 83.3% 1 3.36s 280 8,476
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 10.0 10.0 100.0% 0 2.51s 381 0
Grok 4.20 4.3 1.1 66.7% 1 24.33s 250 12,804
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 2.8 1.6 33.3% 1 9.39s 1,461 0
Grok 4.20 10.0 10.0 100.0% 0 17.40s 232 9,556
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 10.0 10.0 100.0% 0 1.43s 243 0
Grok 4.20 10.0 10.0 100.0% 0 4.17s 180 5,333
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 3.0 10.0 0.0% 0 540ms 15 0
Grok 4.20 5.3 10.0 33.3% 0 27.03s 375 49,339
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 5.0 10.0 0.0% 0 2.51s 126 0
Grok 4.20 5.8 2.8 66.7% 1 7.09s 47 4,252
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 4.8 10.0 0.0% 0 815ms 69 0
Grok 4.20 7.3 5.9 83.3% 1 4.42s 40 5,474
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 6.7 7.9 55.6% 1 1.37s 680 0
Grok 4.20 6.4 7.7 55.6% 1 3.89s 143 8,028
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-27B 10.0 10.0 100.0% 0 3.54s 303 0
Grok 4.20 3.0 10.0 0.0% 0 13.68s 197 6,620

त्वरित तुलना

तुलना जोड़ी बदलें