नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Laguna M.1 vs xAI: Grok 4.20

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-29

मेट्रिक Laguna M.1 Laguna M.1 none रिलीज़: 2026-04-28 निःशुल्क उपलब्ध Grok 4.20 Grok 4.20 none रिलीज़: 2026-03-31
स्कोर 5.1 5.2
रैंक #117 #108
विश्वसनीयता 9.9 लागू नहीं
संगति 8.7 9.5
सही परीक्षण
प्रति प्रयास पास दर 33.3% 29.6%
अस्थिर टेस्ट 3 1
कुल रन 54 54
प्रति परिणाम लागत 0.000 1.889
कुल लागत $0.000 $0.095
???? ??? $0.000 / 1M $2.000 / 1M
????? ??? $0.000 / 1M $6.000 / 1M
आउटपुट टोकन 2,870 1,967
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 2.79s 1.11s
प्रतिक्रिया समय (अधिकतम) 15.42s 6.04s
प्रतिक्रिया समय (कुल) 50.24s 20.02s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Laguna M.1 3.4 7.9 16.7% 1 1.23s 485 0
Grok 4.20 4.8 10.0 25.0% 0 501ms 267 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Laguna M.1 7.5 3.8 66.7% 1 2.93s 543 0
Grok 4.20 3.4 9.3 0.0% 0 1.22s 312 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Laguna M.1 3.0 10.0 0.0% 0 4.32s 622 0
Grok 4.20 3.0 10.0 0.0% 0 6.04s 282 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Laguna M.1 10.0 10.0 100.0% 0 3.37s 246 0
Grok 4.20 10.0 10.0 100.0% 0 522ms 207 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Laguna M.1 3.6 7.2 22.2% 1 5.50s 33 0
Grok 4.20 3.0 10.0 0.0% 0 687ms 325 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Laguna M.1 4.0 10.0 0.0% 0 3.08s 212 0
Grok 4.20 4.8 10.0 0.0% 0 659ms 83 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Laguna M.1 6.3 10.0 50.0% 0 683ms 80 0
Grok 4.20 4.8 10.0 0.0% 0 455ms 60 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Laguna M.1 3.2 10.0 0.0% 0 951ms 340 0
Grok 4.20 5.3 7.4 44.4% 1 487ms 242 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Laguna M.1 10.0 10.0 100.0% 0 7.54s 309 0
Grok 4.20 10.0 10.0 100.0% 0 4.63s 189 0

त्वरित तुलना

तुलना जोड़ी बदलें