নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs StepFun: Step 3.7 Flash

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-05-29

মেট্রিক Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none প্রকাশ: 2026-03-03 Step 3.7 Flash Step 3.7 Flash medium প্রকাশ: 2026-05-29
স্কোর 7.5 7.9
র‍্যাঙ্ক #54 #32
নির্ভরযোগ্যতা 10.0 9.9
ধারাবাহিকতা 9.7 9.2
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 63.3% 71.7%
অস্থির টেস্ট 1 2
মোট রান 60 58
প্রতি ফলাফলে খরচ 0.142 2.663
মোট খরচ $0.017 $0.347
ইনপুট মূল্য $0.250 / 1M $0.200 / 1M
আউটপুট মূল্য $1.500 / 1M $1.150 / 1M
আউটপুট টোকেন 5,541 294,481
রিজনিং টোকেন 0 0
প্রতিক্রিয়া সময় (গড়) 1.23s 18.32s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 3.39s 113.98s
প্রতিক্রিয়া সময় (মোট) 24.68s 366.45s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.1 Flash Lite Preview 7.5 8.4 66.7% 1 1.04s 1,092 0
Step 3.7 Flash 8.7 7.9 91.7% 1 9.65s 32,185 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.1 Flash Lite Preview 6.8 10.0 50.0% 0 1.06s 664 0
Step 3.7 Flash 8.2 6.7 83.3% 1 10.64s 19,320 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 3.20s 339 0
Step 3.7 Flash 10.0 10.0 100.0% 0 9.06s 7,106 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.22s 399 0
Step 3.7 Flash 10.0 10.0 100.0% 0 2.75s 3,020 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 942ms 568 0
Step 3.7 Flash 7.7 10.0 66.7% 0 48.27s 70,347 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 741ms 69 0
Step 3.7 Flash 4.0 10.0 0.0% 0 6.85s 3,987 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.13s 574 0
Step 3.7 Flash 9.8 10.0 100.0% 0 1.83s 2,166 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 900ms 1,045 0
Step 3.7 Flash 5.7 9.9 33.3% 0 6.19s 15,071 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.39s 782 0
Step 3.7 Flash 10.0 10.0 100.0% 0 4.16s 2,115 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 814ms 9 0
Step 3.7 Flash 3.0 10.0 0.0% 0 113.98s 139,164 0

দ্রুত তুলনা

তুলনার জুটি বদলান