नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

Qwen: Qwen3.5-35B-A3B vs xAI: Grok 4.20

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-02

मेट्रिक Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium प्रकाशन: 2026-02-24 Grok 4.20 Grok 4.20 medium प्रकाशन: 2026-03-31
स्कोअर 7.3 7.1
क्रमांक #37 #40
सुसंगतता 6.6 8.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 78.4% 66.7%
अस्थिर चाचण्या 7 4
एकूण रन 51 51
प्रति निकाल खर्च 3.877 7.358
एकूण खर्च $0.349 $0.663
???? ??? $0.163 / 1M $2.000 / 1M
????? ??? $1.300 / 1M $6.000 / 1M
आउटपुट टोकन्स 5,864 1,494
रिझनिंग टोकन्स 175,683 97,078
प्रतिसाद वेळ (सरासरी) 42.48s 9.50s
प्रतिसाद वेळ (कमाल) 106.00s 29.87s
प्रतिसाद वेळ (एकूण) 722.12s 161.54s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 21.13s 798 42,652
Grok 4.20 8.2 7.9 83.3% 1 3.36s 280 8,476
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-35B-A3B 4.7 1.6 66.7% 1 75.34s 775 12,485
Grok 4.20 10.0 10.0 100.0% 0 17.40s 232 9,556
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-35B-A3B 7.3 5.9 83.3% 1 59.33s 235 19,493
Grok 4.20 10.0 10.0 100.0% 0 4.17s 180 5,333
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-35B-A3B 4.1 4.4 44.5% 2 88.34s 41 46,368
Grok 4.20 5.3 10.0 33.3% 0 27.03s 375 49,339
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-35B-A3B 2.8 1.6 33.3% 1 30.30s 20 3,753
Grok 4.20 5.8 2.8 66.7% 1 7.09s 47 4,252
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 24.45s 97 17,361
Grok 4.20 7.3 5.9 83.3% 1 4.42s 40 5,474
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-35B-A3B 6.4 4.4 77.8% 2 31.58s 3,589 32,206
Grok 4.20 6.4 7.7 55.6% 1 3.89s 143 8,028
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 4.65s 309 1,365
Grok 4.20 3.0 10.0 0.0% 0 13.68s 197 6,620

झटपट तुलना

तुलना जोडी बदला