नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.5-9B vs xAI: Grok 4.1 Fast

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-12

मेट्रिक Qwen3.5-9B Qwen3.5-9B none प्रकाशन: 2026-03-02 Grok 4.1 Fast Grok 4.1 Fast medium प्रकाशन: 2025-11-19
क्रमांक #60 #32
सरासरी स्कोअर 3.4 6.2
सुसंगतता 10.0 7.9
प्रति निकाल खर्च 0.111 0.563
एकूण खर्च $0.005 $0.051
बरोबर चाचण्या
प्रति प्रयत्न पास दर 25.0% 66.7%
अस्थिर चाचण्या 0 4
एकूण रन 48 48
आउटपुट टोकन्स 2,939 1,183
रिझनिंग टोकन्स 0 83,875
प्रतिसाद वेळ (सरासरी) 1.06s 26.35s
प्रतिसाद वेळ (कमाल) 5.91s 121.79s
प्रतिसाद वेळ (एकूण) 16.95s 237.11s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

सरासरी स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 10.0 9.9 0.0% 0 1.02s 576 0
Grok 4.1 Fast 10.0 10.0 100.0% 0 5.65s 102 4,021
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 10.0 10.0 0.0% 0 5.91s 1,255 0
Grok 4.1 Fast 10.0 10.0 100.0% 0 37.64s 261 12,272
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 9.9 10.0 100.0% 0 847ms 249 0
Grok 4.1 Fast 9.9 10.0 100.0% 0 6.63s 180 5,409
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 10.0 10.0 0.0% 0 464ms 24 0
Grok 4.1 Fast 4.0 4.4 66.7% 2 121.79s 11 37,657
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 3.0 9.9 0.0% 0 552ms 99 0
Grok 4.1 Fast 3.0 9.9 0.0% 0 16.25s 127 3,456
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 5.5 10.0 50.0% 0 514ms 75 0
Grok 4.1 Fast 5.5 10.0 50.0% 0 5.30s 55 3,489
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 10.0 9.9 0.0% 0 683ms 388 0
Grok 4.1 Fast 4.0 7.2 44.4% 1 8.08s 187 6,086
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-9B 10.0 10.0 100.0% 0 1.27s 273 0
Grok 4.1 Fast 10.0 1.6 33.3% 1 27.71s 260 11,485

झटपट तुलना

तुलना जोडी बदला