नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Qwen: Qwen3.6 Flash vs xAI: Grok 4.20

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-22

मेट्रिक Qwen3.6 Flash Qwen3.6 Flash none रिलीज़: 2026-04-20 Grok 4.20 Grok 4.20 none रिलीज़: 2026-03-31
स्कोर 5.5 5.4
रैंक #116 #120
विश्वसनीयता 9.7 लागू नहीं
संगति 10.0 9.5
सही परीक्षण
प्रति प्रयास पास दर 35.0% 35.2%
अस्थिर टेस्ट 0 1
कुल रन 60 54
प्रति परिणाम लागत 0.259 1.574
कुल लागत $0.019 $0.095
???? ??? $0.188 / 1M $1.250 / 1M
????? ??? $1.125 / 1M $2.500 / 1M
आउटपुट टोकन 4,186 1,967
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.64s 1.11s
प्रतिक्रिया समय (अधिकतम) 4.60s 6.04s
प्रतिक्रिया समय (कुल) 32.88s 20.02s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Flash 3.1 10.0 0.0% 0 1.63s 1,554 0
Grok 4.20 4.8 10.0 25.0% 0 501ms 267 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Flash 6.6 10.0 50.0% 0 2.34s 883 0
Grok 4.20 3.4 9.3 0.0% 0 1.22s 312 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Flash 3.0 10.0 0.0% 0 4.22s 315 0
Grok 4.20 3.0 10.0 0.0% 0 6.04s 282 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Flash 10.0 10.0 100.0% 0 2.13s 243 0
Grok 4.20 10.0 10.0 100.0% 0 522ms 207 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Flash 5.3 10.0 33.3% 0 1.11s 15 0
Grok 4.20 3.0 10.0 0.0% 0 687ms 325 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Flash 10.0 10.0 100.0% 0 947ms 132 0
Grok 4.20 4.8 10.0 0.0% 0 659ms 83 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Flash 6.3 10.0 50.0% 0 1.10s 66 0
Grok 4.20 6.3 10.0 50.0% 0 455ms 60 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Flash 3.5 10.0 0.0% 0 1.20s 697 0
Grok 4.20 5.3 7.2 44.4% 1 487ms 242 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Flash 10.0 10.0 100.0% 0 2.49s 272 0
Grok 4.20 10.0 10.0 100.0% 0 4.63s 189 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Flash 3.0 10.0 0.0% 0 649ms 9 0
Grok 4.20 - - - - - - - -

त्वरित तुलना

तुलना जोड़ी बदलें