नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Qwen: Qwen3.6 Max Preview vs xAI: Grok Build 0.1

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-21

मेट्रिक Qwen3.6 Max Preview Qwen3.6 Max Preview none रिलीज़: 2026-04-20 Grok Build 0.1 Grok Build 0.1 medium रिलीज़: 2026-05-21
स्कोर 7.2 7.8
रैंक #60 #41
विश्वसनीयता 10.0 10.0
संगति 9.1 8.9
सही परीक्षण
प्रति प्रयास पास दर 64.9% 71.9%
अस्थिर टेस्ट 2 3
कुल रन 57 57
प्रति परिणाम लागत 0.755 4.064
कुल लागत $0.083 $0.488
???? ??? $1.040 / 1M $1.000 / 1M
????? ??? $6.240 / 1M $2.000 / 1M
आउटपुट टोकन 4,751 1,947
रीजनिंग टोकन 0 223,372
प्रतिक्रिया समय (औसत) 3.31s 22.28s
प्रतिक्रिया समय (अधिकतम) 20.51s 88.28s
प्रतिक्रिया समय (कुल) 62.80s 423.30s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Max Preview 5.2 7.9 41.7% 1 2.63s 513 0
Grok Build 0.1 10.0 10.0 100.0% 0 5.46s 195 9,825
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Max Preview 5.0 2.0 66.7% 1 3.45s 426 0
Grok Build 0.1 7.3 3.7 66.7% 1 30.98s 354 17,734
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 20.51s 2,842 0
Grok Build 0.1 10.0 10.0 100.0% 0 30.81s 231 18,779
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.87s 243 0
Grok Build 0.1 10.0 10.0 100.0% 0 7.76s 180 10,343
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Max Preview 7.7 10.0 66.7% 0 1.22s 18 0
Grok Build 0.1 5.3 10.0 33.3% 0 77.75s 501 111,807
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Max Preview 4.3 10.0 0.0% 0 1.62s 76 0
Grok Build 0.1 3.8 2.5 33.3% 1 10.14s 78 5,386
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Max Preview 9.8 10.0 100.0% 0 1.45s 69 0
Grok Build 0.1 9.8 10.0 100.0% 0 9.62s 57 12,436
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.38s 323 0
Grok Build 0.1 6.2 7.5 55.6% 1 8.67s 161 15,476
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 5.27s 222 0
Grok Build 0.1 10.0 10.0 100.0% 0 9.40s 180 5,319
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 1.97s 19 0
Grok Build 0.1 3.0 10.0 0.0% 0 26.07s 10 16,267

त्वरित तुलना

तुलना जोड़ी बदलें