नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs xAI: Grok 4.20 Beta

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-12

मेट्रिक Claude Sonnet 4.6 Claude Sonnet 4.6 none प्रकाशन: 2026-02-17 Grok 4.20 Beta Grok 4.20 Beta medium प्रकाशन: 2026-03-12
क्रमांक #27 #24
सरासरी स्कोअर 6.8 7.0
सुसंगतता 9.6 9.0
प्रति निकाल खर्च 2.504 5.989
एकूण खर्च $0.251 $0.599
बरोबर चाचण्या
प्रति प्रयत्न पास दर 66.7% 70.8%
अस्थिर चाचण्या 1 2
एकूण रन 48 48
आउटपुट टोकन्स 6,895 1,481
रिझनिंग टोकन्स 0 86,628
प्रतिसाद वेळ (सरासरी) 5.57s 8.89s
प्रतिसाद वेळ (कमाल) 23.84s 24.21s
प्रतिसाद वेळ (एकूण) 50.12s 142.18s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

सरासरी स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 4.0 10.0 33.3% 0 4.83s 1,199 0
Grok 4.20 Beta 7.0 7.2 88.9% 1 3.19s 262 6,289
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 9.0 10.0 100.0% 0 23.84s 3,766 0
Grok 4.20 Beta 10.0 10.0 100.0% 0 20.93s 227 12,212
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 9.9 10.0 100.0% 0 3.43s 252 0
Grok 4.20 Beta 9.9 10.0 100.0% 0 4.01s 180 5,281
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 7.0 10.0 66.7% 0 3.54s 413 0
Grok 4.20 Beta 4.0 10.0 33.3% 0 21.33s 251 40,255
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 5.0 3.1 66.7% 1 2.56s 192 0
Grok 4.20 Beta 10.0 10.0 100.0% 0 5.78s 72 3,440
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 5.5 10.0 50.0% 0 1.96s 90 0
Grok 4.20 Beta 9.0 10.0 50.0% 0 4.97s 57 7,107
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 7.0 10.0 66.7% 0 2.92s 536 0
Grok 4.20 Beta 7.0 7.2 88.9% 1 3.85s 249 6,660
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 447 0
Grok 4.20 Beta 10.0 10.0 0.0% 0 12.39s 183 5,384

झटपट तुलना

तुलना जोडी बदला