নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.5 Flash vs StepFun: Step 3.7 Flash

সারাংশ

Gemini 3.5 Flash vs Step 3.7 Flash benchmark তুলনা: Step 3.7 Flash average score-এ এগিয়ে: 8.5 vs 7.0. Step 3.7 Flash-এর benchmark খরচ কম: $0.376 vs $1.079. Gemini 3.5 Flash দ্রুত: 9.93s vs 20.35s, pass rates 77.8% vs 73.0%.

প্রস্তাবিত মডেল: Step 3.7 Flash - It has the best score here (8.5), while costing about 2.9x less than Gemini 3.5 Flash.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-12

মেট্রিক Gemini 3.5 Flash Gemini 3.5 Flash none প্রকাশ: 2026-05-19 Step 3.7 Flash Step 3.7 Flash medium প্রকাশ: 2026-05-29
স্কোর 7.0 8.5
র‍্যাঙ্ক #66 #23
নির্ভরযোগ্যতা 10.0 9.9
ধারাবাহিকতা 8.9 9.3
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 77.8% 73.0%
অস্থির টেস্ট 3 2
মোট রান 63 61
প্রতি ফলাফলে খরচ 7.190 2.686
মোট খরচ $1.079 $0.376
ইনপুট মূল্য $1.500 / 1M $0.200 / 1M
আউটপুট মূল্য $9.000 / 1M $1.150 / 1M
মোট ইনপুট টোকেন 13,843 39,981
আউটপুট টোকেন 117,518 319,958
রিজনিং টোকেন 0 0
প্রতিক্রিয়া সময় (গড়) 9.93s 20.35s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 64.36s 113.98s
প্রতিক্রিয়া সময় (মোট) 178.68s 427.42s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#66 Gemini 3.5 Flash

none
Cost
$0.225
Time
125.5s
Tokens
25,004 tok

#23 Step 3.7 Flash

medium
Cost
$0.006
Time
46.2s
Tokens
4,466 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.53s 492 5,101 0
Step 3.7 Flash 8.7 7.9 91.7% 1 9.65s 756 32,185 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.5 Flash 8.8 7.8 88.9% 1 34.69s 8,122 75,927 0
Step 3.7 Flash 8.8 7.8 88.9% 1 27.42s 7,437 44,797 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.5 Flash 3.0 10.0 0.0% 0 0ms 0 0 0
Step 3.7 Flash 10.0 10.0 100.0% 0 9.06s 13,683 7,106 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.5 Flash 6.5 10.0 50.0% 0 8.10s 2,781 5,895 0
Step 3.7 Flash 10.0 10.0 100.0% 0 2.75s 7,398 3,020 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.5 Flash 7.6 7.2 77.8% 1 10.64s 633 17,910 0
Step 3.7 Flash 7.7 10.0 66.7% 0 48.27s 708 70,347 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.46s 486 1,620 0
Step 3.7 Flash 4.0 10.0 0.0% 0 6.85s 525 3,987 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.5 Flash 9.8 10.0 100.0% 0 3.38s 615 3,928 0
Step 3.7 Flash 9.8 10.0 100.0% 0 1.83s 735 2,166 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.13s 558 4,640 0
Step 3.7 Flash 5.7 9.9 33.3% 0 6.19s 756 15,071 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.5 Flash 3.0 10.0 0.0% 0 0ms 0 0 0
Step 3.7 Flash 10.0 10.0 100.0% 0 4.16s 7,746 2,115 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.5 Flash 2.8 1.6 33.3% 1 4.87s 156 2,497 0
Step 3.7 Flash 3.0 10.0 0.0% 0 113.98s 237 139,164 0

দ্রুত তুলনা

তুলনার জুটি বদলান