নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs Google: Gemma 4 31B

সারাংশ

Claude Opus 4.8 vs Gemma 4 31B benchmark তুলনা: Claude Opus 4.8 average score-এ এগিয়ে: 7.2 vs 6.3. Gemma 4 31B-এর benchmark খরচ কম: $0.033 vs $0.539. Claude Opus 4.8 দ্রুত: 3.47s vs 56.55s, pass rates 61.9% vs 69.8%.

প্রস্তাবিত মডেল: Claude Opus 4.8 - It has the best score here (7.2), while responding about 16.3x faster than Gemma 4 31B.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-18

মেট্রিক Claude Opus 4.8 Claude Opus 4.8 none প্রকাশ: 2026-05-28 Gemma 4 31B Gemma 4 31B medium প্রকাশ: 2026-04-02 বিনামূল্যে উপলভ্য
স্কোর 7.2 6.3
র‍্যাঙ্ক #57 #88
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.2 9.4
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 61.9% 69.8%
অস্থির টেস্ট 2 1
মোট রান 63 63
প্রতি ফলাফলে খরচ 4.485 0.257
মোট খরচ $0.539 $0.033
ইনপুট মূল্য $5.000 / 1M $0.120 / 1M
আউটপুট মূল্য $25.000 / 1M $0.350 / 1M
মোট ইনপুট টোকেন 67,104 17,957
আউটপুট টোকেন 8,107 22,356
রিজনিং টোকেন 0 65,726
প্রতিক্রিয়া সময় (গড়) 3.47s 56.55s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 17.73s 437.40s
প্রতিক্রিয়া সময় (মোট) 72.90s 1074.41s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#57 Claude Opus 4.8

none
খরচ
$0.053
সময়
22.0s
টোকেন
2,253 tok

#88 Gemma 4 31B

medium
খরচ
$0.002
সময়
45.7s
টোকেন
2,696 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 6.5 10.0 50.0% 0 3.40s 834 1,472 0
Gemma 4 31B 10.0 10.0 100.0% 0 12.89s 816 962 2,046
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 5.5 10.0 33.3% 0 3.29s 10,590 1,332 0
Gemma 4 31B 4.3 5.8 22.2% 1 219.76s 5,568 11,098 33,212
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 9.5 10.0 100.0% 0 17.73s 29,658 3,259 0
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 7.3 5.8 83.3% 1 1.77s 10,503 308 0
Gemma 4 31B 10.0 10.0 100.0% 0 21.11s 8,334 1,822 2,951
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 5.3 7.2 44.4% 1 1.66s 975 61 0
Gemma 4 31B 7.7 10.0 66.7% 0 38.48s 876 4,349 8,985
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 10.0 10.0 100.0% 0 3.48s 708 230 0
Gemma 4 31B 10.0 10.0 100.0% 0 9.57s 567 105 888
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 9.9 10.0 100.0% 0 1.37s 909 95 0
Gemma 4 31B 10.0 10.0 100.0% 0 12.76s 777 533 2,035
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 7.7 10.0 66.7% 0 2.74s 894 783 0
Gemma 4 31B 9.9 10.0 100.0% 0 26.91s 801 1,795 5,595
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 10.0 10.0 100.0% 0 5.35s 11,775 355 0
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 3.0 10.0 0.0% 0 3.41s 258 212 0
Gemma 4 31B 3.0 10.0 0.0% 0 90.14s 218 1,692 10,014

দ্রুত তুলনা

তুলনার জুটি বদলান