नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

Qwen: Qwen3.6 Max Preview vs xAI: Grok 4.20

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-27

मेट्रिक Qwen3.6 Max Preview Qwen3.6 Max Preview none प्रकाशन: 2026-04-20 Grok 4.20 Grok 4.20 medium प्रकाशन: 2026-03-31
स्कोअर 7.3 7.0
क्रमांक #56 #61
विश्वसनीयता 10.0 लागू नाही
सुसंगतता 8.7 7.8
बरोबर चाचण्या
प्रति प्रयत्न पास दर 66.7% 66.7%
अस्थिर चाचण्या 3 5
एकूण रन 54 54
प्रति निकाल खर्च 0.827 8.252
एकूण खर्च $0.083 $0.743
???? ??? $1.300 / 1M $2.000 / 1M
????? ??? $7.800 / 1M $6.000 / 1M
आउटपुट टोकन्स 4,732 1,744
रिझनिंग टोकन्स 0 109,882
प्रतिसाद वेळ (सरासरी) 3.38s 10.33s
प्रतिसाद वेळ (कमाल) 20.51s 29.87s
प्रतिसाद वेळ (एकूण) 60.83s 185.87s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 5.2 7.9 41.7% 1 2.63s 513 0
Grok 4.20 8.2 7.9 83.3% 1 3.36s 280 8,476
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 5.0 2.0 66.7% 1 3.45s 426 0
Grok 4.20 4.3 1.1 66.7% 1 24.33s 250 12,804
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 20.51s 2,842 0
Grok 4.20 10.0 10.0 100.0% 0 17.40s 232 9,556
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.87s 243 0
Grok 4.20 10.0 10.0 100.0% 0 4.17s 180 5,333
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 7.7 10.0 66.7% 0 1.22s 18 0
Grok 4.20 5.3 10.0 33.3% 0 27.03s 375 49,339
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 4.3 10.0 0.0% 0 1.62s 76 0
Grok 4.20 5.8 2.8 66.7% 1 7.09s 47 4,252
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 8.4 6.9 83.3% 1 1.45s 69 0
Grok 4.20 7.3 5.9 83.3% 1 4.42s 40 5,474
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.38s 323 0
Grok 4.20 6.4 7.7 55.6% 1 3.89s 143 8,028
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 5.27s 222 0
Grok 4.20 3.0 10.0 0.0% 0 13.68s 197 6,620

झटपट तुलना

तुलना जोडी बदला