नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Qwen: Qwen3.5-9B vs xAI: Grok 4.1 Fast

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-04

मेट्रिक Qwen3.5-9B Qwen3.5-9B none रिलीज़: 2026-03-02 Grok 4.1 Fast Grok 4.1 Fast none रिलीज़: 2025-11-19
स्कोर 4.8 4.4
रैंक #82 #86
संगति 10.0 9.0
सही परीक्षण
प्रति प्रयास पास दर 23.5% 23.5%
अस्थिर टेस्ट 0 2
कुल रन 51 51
प्रति परिणाम लागत 0.111 0.251
कुल लागत $0.005 $0.008
???? ??? $0.050 / 1M $0.200 / 1M
????? ??? $0.150 / 1M $0.500 / 1M
आउटपुट टोकन 2,945 1,154
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.22s 1.76s
प्रतिक्रिया समय (अधिकतम) 5.91s 5.51s
प्रतिक्रिया समय (कुल) 20.74s 17.56s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-9B 3.1 9.9 0.0% 0 1.71s 582 0
Grok 4.1 Fast 3.2 10.0 0.0% 0 1.07s 235 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-9B 3.0 10.0 0.0% 0 5.91s 1,255 0
Grok 4.1 Fast 3.0 10.0 0.0% 0 3.33s 105 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-9B 10.0 10.0 100.0% 0 847ms 249 0
Grok 4.1 Fast 10.0 10.0 100.0% 0 943ms 180 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-9B 3.0 10.0 0.0% 0 464ms 24 0
Grok 4.1 Fast 5.9 7.2 55.6% 1 1.06s 15 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-9B 4.4 9.9 0.0% 0 552ms 99 0
Grok 4.1 Fast 4.4 9.9 0.0% 0 1.08s 112 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-9B 6.5 10.0 50.0% 0 514ms 75 0
Grok 4.1 Fast 3.0 10.0 0.0% 0 923ms 56 0
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-9B 3.2 9.9 0.0% 0 683ms 388 0
Grok 4.1 Fast 3.2 10.0 0.0% 0 1.28s 243 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Qwen3.5-9B 10.0 10.0 100.0% 0 1.27s 273 0
Grok 4.1 Fast 2.8 1.6 33.3% 1 5.51s 208 0

त्वरित तुलना

तुलना जोड़ी बदलें