नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Qwen: Qwen3.5-122B-A10B vs xAI: Grok 4.20

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-22

मेट्रिक Qwen3.5-122B-A10B Qwen3.5-122B-A10B none रिलीज़: 2026-02-24 Grok 4.20 Grok 4.20 none रिलीज़: 2026-03-31
स्कोर 5.4 5.4
रैंक #124 #120
विश्वसनीयता 10.0 लागू नहीं
संगति 9.2 9.5
सही परीक्षण
प्रति प्रयास पास दर 35.0% 35.2%
अस्थिर टेस्ट 2 1
कुल रन 60 54
प्रति परिणाम लागत 0.380 1.574
कुल लागत $0.023 $0.095
???? ??? $0.260 / 1M $1.250 / 1M
????? ??? $2.080 / 1M $2.500 / 1M
आउटपुट टोकन 3,375 1,967
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 3.38s 1.11s
प्रतिक्रिया समय (अधिकतम) 46.00s 6.04s
प्रतिक्रिया समय (कुल) 67.64s 20.02s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-122B-A10B 4.8 10.0 25.0% 0 1.59s 312 0
Grok 4.20 4.8 10.0 25.0% 0 501ms 267 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-122B-A10B 4.0 5.5 33.3% 1 2.14s 684 0
Grok 4.20 3.4 9.3 0.0% 0 1.22s 312 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-122B-A10B 3.0 10.0 0.0% 0 46.00s 1,137 0
Grok 4.20 3.0 10.0 0.0% 0 6.04s 282 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 1.01s 243 0
Grok 4.20 10.0 10.0 100.0% 0 522ms 207 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-122B-A10B 5.3 10.0 33.3% 0 465ms 15 0
Grok 4.20 3.0 10.0 0.0% 0 687ms 325 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-122B-A10B 5.0 10.0 0.0% 0 1.12s 66 0
Grok 4.20 4.8 10.0 0.0% 0 659ms 83 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-122B-A10B 6.3 10.0 50.0% 0 585ms 70 0
Grok 4.20 6.3 10.0 50.0% 0 455ms 60 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-122B-A10B 3.7 7.7 11.1% 1 982ms 575 0
Grok 4.20 5.3 7.2 44.4% 1 487ms 242 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 2.04s 264 0
Grok 4.20 10.0 10.0 100.0% 0 4.63s 189 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-122B-A10B 3.0 10.0 0.0% 0 295ms 9 0
Grok 4.20 - - - - - - - -

त्वरित तुलना

तुलना जोड़ी बदलें