नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.5-9B vs xAI: Grok 4.1 Fast

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-04

मेट्रिक Qwen3.5-9B Qwen3.5-9B none प्रकाशन: 2026-03-02 Grok 4.1 Fast Grok 4.1 Fast none प्रकाशन: 2025-11-19
स्कोअर 4.8 4.4
क्रमांक #82 #86
सुसंगतता 10.0 9.0
बरोबर चाचण्या
प्रति प्रयत्न पास दर 23.5% 23.5%
अस्थिर चाचण्या 0 2
एकूण रन 51 51
प्रति निकाल खर्च 0.111 0.251
एकूण खर्च $0.005 $0.008
???? ??? $0.050 / 1M $0.200 / 1M
????? ??? $0.150 / 1M $0.500 / 1M
आउटपुट टोकन्स 2,945 1,154
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 1.22s 1.76s
प्रतिसाद वेळ (कमाल) 5.91s 5.51s
प्रतिसाद वेळ (एकूण) 20.74s 17.56s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 3.1 9.9 0.0% 0 1.71s 582 0
Grok 4.1 Fast 3.2 10.0 0.0% 0 1.07s 235 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 3.0 10.0 0.0% 0 5.91s 1,255 0
Grok 4.1 Fast 3.0 10.0 0.0% 0 3.33s 105 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 10.0 10.0 100.0% 0 847ms 249 0
Grok 4.1 Fast 10.0 10.0 100.0% 0 943ms 180 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 3.0 10.0 0.0% 0 464ms 24 0
Grok 4.1 Fast 5.9 7.2 55.6% 1 1.06s 15 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 4.4 9.9 0.0% 0 552ms 99 0
Grok 4.1 Fast 4.4 9.9 0.0% 0 1.08s 112 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 6.5 10.0 50.0% 0 514ms 75 0
Grok 4.1 Fast 3.0 10.0 0.0% 0 923ms 56 0
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 3.2 9.9 0.0% 0 683ms 388 0
Grok 4.1 Fast 3.2 10.0 0.0% 0 1.28s 243 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 10.0 10.0 100.0% 0 1.27s 273 0
Grok 4.1 Fast 2.8 1.6 33.3% 1 5.51s 208 0

झटपट तुलना

तुलना जोडी बदला