नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

Qwen: Qwen3.5-Flash vs xAI: Grok 4.20 Beta

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-12

मेट्रिक Qwen3.5-Flash Qwen3.5-Flash none प्रकाशन: 2026-02-24 Grok 4.20 Beta Grok 4.20 Beta medium प्रकाशन: 2026-03-12
क्रमांक #41 #24
सरासरी स्कोअर 5.2 7.0
सुसंगतता 9.6 9.0
प्रति निकाल खर्च 0.077 5.989
एकूण खर्च $0.006 $0.599
बरोबर चाचण्या
प्रति प्रयत्न पास दर 45.8% 70.8%
अस्थिर चाचण्या 1 2
एकूण रन 48 48
आउटपुट टोकन्स 3,774 1,481
रिझनिंग टोकन्स 0 86,628
प्रतिसाद वेळ (सरासरी) 3.54s 8.89s
प्रतिसाद वेळ (कमाल) 13.73s 24.21s
प्रतिसाद वेळ (एकूण) 56.70s 142.18s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

सरासरी स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-Flash 2.3 7.8 11.1% 1 1.62s 687 0
Grok 4.20 Beta 7.0 7.2 88.9% 1 3.19s 262 6,289
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-Flash 10.0 10.0 0.0% 0 6.22s 1,794 0
Grok 4.20 Beta 10.0 10.0 100.0% 0 20.93s 227 12,212
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-Flash 9.9 10.0 100.0% 0 1.57s 243 0
Grok 4.20 Beta 9.9 10.0 100.0% 0 4.01s 180 5,281
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-Flash 7.0 10.0 66.7% 0 905ms 15 0
Grok 4.20 Beta 4.0 10.0 33.3% 0 21.33s 251 40,255
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-Flash 10.0 10.0 100.0% 0 803ms 100 0
Grok 4.20 Beta 10.0 10.0 100.0% 0 5.78s 72 3,440
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-Flash 5.0 10.0 50.0% 0 8.81s 63 0
Grok 4.20 Beta 9.0 10.0 50.0% 0 4.97s 57 7,107
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-Flash 1.3 10.0 0.0% 0 5.90s 608 0
Grok 4.20 Beta 7.0 7.2 88.9% 1 3.85s 249 6,660
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.5-Flash 10.0 10.0 100.0% 0 3.67s 264 0
Grok 4.20 Beta 10.0 10.0 0.0% 0 12.39s 183 5,384

झटपट तुलना

तुलना जोडी बदला