নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemma 4 31B vs Poolside: Laguna XS 2.1

সারাংশ

Gemma 4 31B vs Laguna XS 2.1 benchmark তুলনা: Gemma 4 31B average score-এ এগিয়ে: 6.3 vs 5.3. Laguna XS 2.1-এর benchmark খরচ কম: $0.003 vs $0.033. Laguna XS 2.1 দ্রুত: 722ms vs 56.55s, pass rates 69.8% vs 31.8%.

প্রস্তাবিত মডেল: Gemma 4 31B - It has the strongest score in this comparison (6.3) and the best overall balance of cost and response time across all 2 models.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-07-02

মেট্রিক Gemma 4 31B Gemma 4 31B medium প্রকাশ: 2026-04-02 বিনামূল্যে উপলভ্য Laguna XS 2.1 Laguna XS 2.1 none প্রকাশ: 2026-07-02 বিনামূল্যে উপলভ্য
স্কোর 6.3 5.3
র‍্যাঙ্ক #91 #128
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.4 9.0
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 69.8% 31.8%
অস্থির টেস্ট 1 3
মোট রান 63 63
প্রতি ফলাফলে খরচ 0.257 0.058
মোট খরচ $0.033 $0.003
ইনপুট মূল্য $0.120 / 1M $0.060 / 1M
আউটপুট মূল্য $0.350 / 1M $0.120 / 1M
মোট ইনপুট টোকেন 17,957 41,148
আউটপুট টোকেন 22,356 3,451
রিজনিং টোকেন 65,726 0
প্রতিক্রিয়া সময় (গড়) 56.55s 722ms
প্রতিক্রিয়া সময় (সর্বোচ্চ) 437.40s 2.30s
প্রতিক্রিয়া সময় (মোট) 1074.41s 15.17s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#91 Gemma 4 31B

medium
খরচ
$0.002
সময়
45.7s
টোকেন
2,696 tok

#128 Laguna XS 2.1

none
খরচ
$0.001
সময়
27.6s
টোকেন
4,344 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemma 4 31B 10.0 10.0 100.0% 0 12.89s 816 962 2,046
Laguna XS 2.1 5.3 8.3 33.3% 1 755ms 774 1,015 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemma 4 31B 4.3 5.8 22.2% 1 219.76s 5,568 11,098 33,212
Laguna XS 2.1 4.3 7.8 22.2% 1 623ms 7,995 562 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
Laguna XS 2.1 3.0 10.0 0.0% 0 1.76s 14,197 402 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemma 4 31B 10.0 10.0 100.0% 0 21.11s 8,334 1,822 2,951
Laguna XS 2.1 10.0 10.0 100.0% 0 768ms 7,734 240 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemma 4 31B 7.7 10.0 66.7% 0 38.48s 876 4,349 8,985
Laguna XS 2.1 5.3 10.0 33.3% 0 364ms 834 14 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemma 4 31B 10.0 10.0 100.0% 0 9.57s 567 105 888
Laguna XS 2.1 5.0 10.0 0.0% 0 529ms 537 128 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemma 4 31B 10.0 10.0 100.0% 0 12.76s 777 533 2,035
Laguna XS 2.1 3.8 5.8 33.3% 1 364ms 638 50 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemma 4 31B 9.9 10.0 100.0% 0 26.91s 801 1,795 5,595
Laguna XS 2.1 3.0 10.0 0.0% 0 1.01s 771 730 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
Laguna XS 2.1 10.0 10.0 100.0% 0 1.36s 7,413 300 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemma 4 31B 3.0 10.0 0.0% 0 90.14s 218 1,692 10,014
Laguna XS 2.1 3.0 10.0 0.0% 0 254ms 255 10 0

দ্রুত তুলনা

তুলনার জুটি বদলান