নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemma 4 31B vs OpenAI: GPT-5.4

সারাংশ

Gemma 4 31B vs GPT-5.4 benchmark তুলনা: Gemma 4 31B average score-এ এগিয়ে: 6.3 vs 5.8. Gemma 4 31B-এর benchmark খরচ কম: $0.033 vs $0.122. GPT-5.4 দ্রুত: 1.42s vs 56.55s, pass rates 69.8% vs 36.5%.

প্রস্তাবিত মডেল: Gemma 4 31B - It has the best score here (6.3), while costing about 3.7x less than GPT-5.4.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-12

মেট্রিক Gemma 4 31B Gemma 4 31B medium প্রকাশ: 2026-04-02 বিনামূল্যে উপলভ্য GPT-5.4 GPT-5.4 none প্রকাশ: 2026-03-05
স্কোর 6.3 5.8
র‍্যাঙ্ক #87 #116
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.4 9.2
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 69.8% 36.5%
অস্থির টেস্ট 1 2
মোট রান 63 63
প্রতি ফলাফলে খরচ 0.257 1.740
মোট খরচ $0.033 $0.122
ইনপুট মূল্য $0.120 / 1M $2.500 / 1M
আউটপুট মূল্য $0.350 / 1M $15.000 / 1M
মোট ইনপুট টোকেন 17,957 34,212
আউটপুট টোকেন 22,356 2,417
রিজনিং টোকেন 65,726 0
প্রতিক্রিয়া সময় (গড়) 56.55s 1.42s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 437.40s 2.95s
প্রতিক্রিয়া সময় (মোট) 1074.41s 29.87s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#87 Gemma 4 31B

medium
Cost
$0.002
Time
45.7s
Tokens
2,696 tok

#116 GPT-5.4

none
Cost
$0.026
Time
18.1s
Tokens
1,792 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemma 4 31B 10.0 10.0 100.0% 0 12.89s 816 962 2,046
GPT-5.4 3.2 8.0 8.3% 1 1.21s 606 406 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemma 4 31B 4.3 5.8 22.2% 1 219.76s 5,568 11,098 33,212
GPT-5.4 5.5 10.0 33.3% 0 1.62s 7,305 516 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
GPT-5.4 3.0 10.0 0.0% 0 2.89s 11,019 291 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemma 4 31B 10.0 10.0 100.0% 0 21.11s 8,334 1,822 2,951
GPT-5.4 10.0 10.0 100.0% 0 1.04s 7,140 222 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemma 4 31B 7.7 10.0 66.7% 0 38.48s 876 4,349 8,985
GPT-5.4 5.3 7.2 44.4% 1 1.07s 723 50 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemma 4 31B 10.0 10.0 100.0% 0 9.57s 567 105 888
GPT-5.4 4.4 9.9 0.0% 0 1.78s 477 184 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemma 4 31B 10.0 10.0 100.0% 0 12.76s 777 533 2,035
GPT-5.4 6.5 10.0 50.0% 0 1.07s 660 81 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemma 4 31B 9.9 10.0 100.0% 0 26.91s 801 1,795 5,595
GPT-5.4 5.6 9.8 33.3% 0 1.44s 642 381 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
GPT-5.4 10.0 10.0 100.0% 0 2.75s 5,445 246 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemma 4 31B 3.0 10.0 0.0% 0 90.14s 218 1,692 10,014
GPT-5.4 3.0 10.0 0.0% 0 990ms 195 40 0

দ্রুত তুলনা

তুলনার জুটি বদলান