नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Poolside: Laguna XS 2.1 vs xAI: Grok 4.20

सारांश

Laguna XS 2.1 vs Grok 4.20 benchmark तुलना: Laguna XS 2.1 average score में आगे है: 5.3 vs 4.4. Laguna XS 2.1 की benchmark लागत कम है: $0.003 vs $0.057. Laguna XS 2.1 तेज है: 722ms vs 1.11s, pass rates 31.8% vs 28.6%.

अनुशंसित मॉडल: Laguna XS 2.1 - It has the best score here (5.3), while costing about 19.6x less than Grok 4.20.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-02

मेट्रिक Laguna XS 2.1 Laguna XS 2.1 none रिलीज़: 2026-07-02 निःशुल्क उपलब्ध Grok 4.20 Grok 4.20 none रिलीज़: 2026-03-31
स्कोर 5.3 4.4
रैंक #128 #160
विश्वसनीयता 10.0 लागू नहीं
संगति 9.0 8.5
सही परीक्षण
प्रति प्रयास पास दर 31.8% 28.6%
अस्थिर टेस्ट 3 0
कुल रन 63 54
प्रति परिणाम लागत 0.058 1.570
कुल लागत $0.003 $0.057
इनपुट कीमत $0.060 / 1M $1.250 / 1M
आउटपुट कीमत $0.120 / 1M $2.500 / 1M
कुल इनपुट टोकन 41,148 41,313
आउटपुट टोकन 3,451 1,923
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 722ms 1.11s
प्रतिक्रिया समय (अधिकतम) 2.30s 6.04s
प्रतिक्रिया समय (कुल) 15.17s 19.96s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#128 Laguna XS 2.1

none
लागत
$0.001
समय
27.6s
टोकन
4,344 tok

#160 xAI: Grok 4.20

none
लागत
$0.004
समय
6.5s
टोकन
1,367 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Laguna XS 2.1 5.3 8.3 33.3% 1 755ms 774 1,015 0
Grok 4.20 4.8 10.0 25.0% 0 501ms 1,986 267 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Laguna XS 2.1 4.3 7.8 22.2% 1 623ms 7,995 562 0
Grok 4.20 1.1 3.1 0.0% 0 1.22s 1,074 312 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Laguna XS 2.1 3.0 10.0 0.0% 0 1.76s 14,197 402 0
Grok 4.20 3.0 10.0 0.0% 0 6.04s 17,673 282 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Laguna XS 2.1 10.0 10.0 100.0% 0 768ms 7,734 240 0
Grok 4.20 10.0 10.0 100.0% 0 522ms 7,749 207 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Laguna XS 2.1 5.3 10.0 33.3% 0 364ms 834 14 0
Grok 4.20 3.0 10.0 0.0% 0 687ms 1,746 325 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Laguna XS 2.1 5.0 10.0 0.0% 0 529ms 537 128 0
Grok 4.20 4.8 10.0 0.0% 0 659ms 819 83 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Laguna XS 2.1 3.8 5.8 33.3% 1 364ms 638 50 0
Grok 4.20 6.3 10.0 50.0% 0 445ms 1,350 60 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Laguna XS 2.1 3.0 10.0 0.0% 0 1.01s 771 730 0
Grok 4.20 5.3 10.0 33.3% 0 473ms 1,671 198 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Laguna XS 2.1 10.0 10.0 100.0% 0 1.36s 7,413 300 0
Grok 4.20 10.0 10.0 100.0% 0 4.63s 7,245 189 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Laguna XS 2.1 3.0 10.0 0.0% 0 254ms 255 10 0
Grok 4.20 0.0 0.0 0.0% 0 0ms 0 0 0

त्वरित तुलना

तुलना जोड़ी बदलें