नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

Laguna M.1 vs xAI: Grok 4.20

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-29

मेट्रिक Laguna M.1 Laguna M.1 none प्रकाशन: 2026-04-28 मोफत उपलब्ध Grok 4.20 Grok 4.20 none प्रकाशन: 2026-03-31
स्कोअर 5.1 5.2
क्रमांक #117 #108
विश्वसनीयता 9.9 लागू नाही
सुसंगतता 8.7 9.5
बरोबर चाचण्या
प्रति प्रयत्न पास दर 33.3% 29.6%
अस्थिर चाचण्या 3 1
एकूण रन 54 54
प्रति निकाल खर्च 0.000 1.889
एकूण खर्च $0.000 $0.095
???? ??? $0.000 / 1M $2.000 / 1M
????? ??? $0.000 / 1M $6.000 / 1M
आउटपुट टोकन्स 2,870 1,967
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 2.79s 1.11s
प्रतिसाद वेळ (कमाल) 15.42s 6.04s
प्रतिसाद वेळ (एकूण) 50.24s 20.02s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Laguna M.1 3.4 7.9 16.7% 1 1.23s 485 0
Grok 4.20 4.8 10.0 25.0% 0 501ms 267 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Laguna M.1 7.5 3.8 66.7% 1 2.93s 543 0
Grok 4.20 3.4 9.3 0.0% 0 1.22s 312 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Laguna M.1 3.0 10.0 0.0% 0 4.32s 622 0
Grok 4.20 3.0 10.0 0.0% 0 6.04s 282 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Laguna M.1 10.0 10.0 100.0% 0 3.37s 246 0
Grok 4.20 10.0 10.0 100.0% 0 522ms 207 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Laguna M.1 3.6 7.2 22.2% 1 5.50s 33 0
Grok 4.20 3.0 10.0 0.0% 0 687ms 325 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Laguna M.1 4.0 10.0 0.0% 0 3.08s 212 0
Grok 4.20 4.8 10.0 0.0% 0 659ms 83 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Laguna M.1 6.3 10.0 50.0% 0 683ms 80 0
Grok 4.20 4.8 10.0 0.0% 0 455ms 60 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Laguna M.1 3.2 10.0 0.0% 0 951ms 340 0
Grok 4.20 5.3 7.4 44.4% 1 487ms 242 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Laguna M.1 10.0 10.0 100.0% 0 7.54s 309 0
Grok 4.20 10.0 10.0 100.0% 0 4.63s 189 0

झटपट तुलना

तुलना जोडी बदला