नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Qwen: Qwen3.5 Plus 2026-02-15 vs xAI: Grok 4.20

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-10

मेट्रिक Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none रिलीज़: 2026-02-15 Grok 4.20 Grok 4.20 medium रिलीज़: 2026-03-31
स्कोर 6.5 6.9
रैंक #78 #68
विश्वसनीयता 10.0 10.0
संगति 9.3 8.3
सही परीक्षण
प्रति प्रयास पास दर 50.9% 63.2%
अस्थिर टेस्ट 2 4
कुल रन 57 57
प्रति परिणाम लागत 0.183 7.559
कुल लागत $0.017 $0.756
???? ??? $0.260 / 1M $1.250 / 1M
????? ??? $1.560 / 1M $2.500 / 1M
आउटपुट टोकन 2,472 1,784
रीजनिंग टोकन 0 128,233
प्रतिक्रिया समय (औसत) 2.49s 14.53s
प्रतिक्रिया समय (अधिकतम) 6.65s 63.48s
प्रतिक्रिया समय (कुल) 32.33s 276.06s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 4.8 10.0 25.0% 0 1.91s 517 0
Grok 4.20 8.2 7.9 83.3% 1 3.95s 287 8,312
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 6.3 3.7 33.3% 1 3.63s 443 0
Grok 4.20 4.3 1.1 66.7% 1 24.33s 250 12,804
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 3.0 10.0 0.0% 0 6.65s 314 0
Grok 4.20 10.0 10.0 100.0% 0 17.40s 232 9,556
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 1.89s 243 0
Grok 4.20 10.0 10.0 100.0% 0 4.17s 180 5,333
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 5.3 10.0 33.3% 0 1.17s 17 0
Grok 4.20 5.3 10.0 33.3% 0 27.03s 375 49,339
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 4.4 3.0 33.3% 1 2.26s 117 0
Grok 4.20 3.9 2.6 33.3% 1 24.48s 65 6,440
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 1.67s 72 0
Grok 4.20 7.3 6.0 83.3% 1 4.42s 40 5,474
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 7.7 10.0 66.7% 0 2.82s 516 0
Grok 4.20 7.7 10.0 66.7% 0 6.20s 149 7,913
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 3.33s 222 0
Grok 4.20 3.0 10.0 0.0% 0 13.68s 197 6,620
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5 Plus 2026-02-15 3.0 10.0 0.0% 0 1.11s 11 0
Grok 4.20 3.0 10.0 0.0% 0 63.48s 9 16,442

त्वरित तुलना

तुलना जोड़ी बदलें