नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Google: Gemma 4 31B vs Poolside: Laguna XS 2.1

सारांश

Gemma 4 31B vs Laguna XS 2.1 benchmark तुलना: Gemma 4 31B average score में आगे है: 6.3 vs 5.3. Laguna XS 2.1 की benchmark लागत कम है: $0.003 vs $0.033. Laguna XS 2.1 तेज है: 722ms vs 56.55s, pass rates 69.8% vs 31.8%.

अनुशंसित मॉडल: Gemma 4 31B - It has the strongest score in this comparison (6.3) and the best overall balance of cost and response time across all 2 models.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-02

मेट्रिक Gemma 4 31B Gemma 4 31B medium रिलीज़: 2026-04-02 निःशुल्क उपलब्ध Laguna XS 2.1 Laguna XS 2.1 none रिलीज़: 2026-07-02 निःशुल्क उपलब्ध
स्कोर 6.3 5.3
रैंक #91 #128
विश्वसनीयता 10.0 10.0
संगति 9.4 9.0
सही परीक्षण
प्रति प्रयास पास दर 69.8% 31.8%
अस्थिर टेस्ट 1 3
कुल रन 63 63
प्रति परिणाम लागत 0.257 0.058
कुल लागत $0.033 $0.003
इनपुट कीमत $0.120 / 1M $0.060 / 1M
आउटपुट कीमत $0.350 / 1M $0.120 / 1M
कुल इनपुट टोकन 17,957 41,148
आउटपुट टोकन 22,356 3,451
रीजनिंग टोकन 65,726 0
प्रतिक्रिया समय (औसत) 56.55s 722ms
प्रतिक्रिया समय (अधिकतम) 437.40s 2.30s
प्रतिक्रिया समय (कुल) 1074.41s 15.17s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#91 Gemma 4 31B

medium
लागत
$0.002
समय
45.7s
टोकन
2,696 tok

#128 Laguna XS 2.1

none
लागत
$0.001
समय
27.6s
टोकन
4,344 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 12.89s 816 962 2,046
Laguna XS 2.1 5.3 8.3 33.3% 1 755ms 774 1,015 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 4.3 5.8 22.2% 1 219.76s 5,568 11,098 33,212
Laguna XS 2.1 4.3 7.8 22.2% 1 623ms 7,995 562 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
Laguna XS 2.1 3.0 10.0 0.0% 0 1.76s 14,197 402 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 21.11s 8,334 1,822 2,951
Laguna XS 2.1 10.0 10.0 100.0% 0 768ms 7,734 240 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 7.7 10.0 66.7% 0 38.48s 876 4,349 8,985
Laguna XS 2.1 5.3 10.0 33.3% 0 364ms 834 14 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 9.57s 567 105 888
Laguna XS 2.1 5.0 10.0 0.0% 0 529ms 537 128 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 12.76s 777 533 2,035
Laguna XS 2.1 3.8 5.8 33.3% 1 364ms 638 50 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 9.9 10.0 100.0% 0 26.91s 801 1,795 5,595
Laguna XS 2.1 3.0 10.0 0.0% 0 1.01s 771 730 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
Laguna XS 2.1 10.0 10.0 100.0% 0 1.36s 7,413 300 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 3.0 10.0 0.0% 0 90.14s 218 1,692 10,014
Laguna XS 2.1 3.0 10.0 0.0% 0 254ms 255 10 0

त्वरित तुलना

तुलना जोड़ी बदलें