नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

Qwen: Qwen3.6 27B vs xAI: Grok 4.20

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-27

मेट्रिक Qwen3.6 27B Qwen3.6 27B medium प्रकाशन: 2026-04-20 Grok 4.20 Grok 4.20 medium प्रकाशन: 2026-03-31
स्कोअर 7.0 7.0
क्रमांक #60 #61
विश्वसनीयता 10.0 लागू नाही
सुसंगतता 7.9 7.8
बरोबर चाचण्या
प्रति प्रयत्न पास दर 64.8% 66.7%
अस्थिर चाचण्या 5 5
एकूण रन 54 54
प्रति निकाल खर्च 2.321 8.252
एकूण खर्च $0.209 $0.743
???? ??? $0.500 / 1M $2.000 / 1M
????? ??? $2.000 / 1M $6.000 / 1M
आउटपुट टोकन्स 8,279 1,744
रिझनिंग टोकन्स 91,083 109,882
प्रतिसाद वेळ (सरासरी) 50.53s 10.33s
प्रतिसाद वेळ (कमाल) 168.22s 29.87s
प्रतिसाद वेळ (एकूण) 909.49s 185.87s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 27B 8.3 10.0 75.0% 0 12.62s 582 4,311
Grok 4.20 8.2 7.9 83.3% 1 3.36s 280 8,476
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 27B 10.0 10.0 100.0% 0 168.22s 433 17,861
Grok 4.20 4.3 1.1 66.7% 1 24.33s 250 12,804
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 27B 7.0 3.7 66.7% 1 83.07s 2,088 14,689
Grok 4.20 10.0 10.0 100.0% 0 17.40s 232 9,556
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 27B 3.5 1.4 50.0% 2 37.30s 568 9,404
Grok 4.20 10.0 10.0 100.0% 0 4.17s 180 5,333
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 27B 2.9 7.2 11.1% 1 73.38s 3,510 20,352
Grok 4.20 5.3 10.0 33.3% 0 27.03s 375 49,339
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 27B 6.5 3.4 66.7% 1 39.53s 81 3,045
Grok 4.20 5.8 2.8 66.7% 1 7.09s 47 4,252
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 27B 10.0 10.0 100.0% 0 37.96s 346 6,548
Grok 4.20 7.3 5.9 83.3% 1 4.42s 40 5,474
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 27B 7.7 10.0 66.7% 0 60.21s 281 11,919
Grok 4.20 6.4 7.7 55.6% 1 3.89s 143 8,028
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Qwen3.6 27B 10.0 10.0 100.0% 0 16.88s 390 2,954
Grok 4.20 3.0 10.0 0.0% 0 13.68s 197 6,620

झटपट तुलना

तुलना जोडी बदला