নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5 Mini vs StepFun: Step 3.7 Flash

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-05-29

মেট্রিক GPT-5 Mini GPT-5 Mini medium প্রকাশ: 2025-08-07 Step 3.7 Flash Step 3.7 Flash high প্রকাশ: 2026-05-29
স্কোর 7.2 7.1
র‍্যাঙ্ক #73 #74
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.1 8.2
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 61.7% 65.8%
অস্থির টেস্ট 2 4
মোট রান 60 60
প্রতি ফলাফলে খরচ 1.348 8.723
মোট খরচ $0.149 $0.960
ইনপুট মূল্য $0.250 / 1M $0.200 / 1M
আউটপুট মূল্য $2.000 / 1M $1.150 / 1M
আউটপুট টোকেন 6,723 828,084
রিজনিং টোকেন 63,082 0
প্রতিক্রিয়া সময় (গড়) 23.75s 49.43s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 88.15s 192.75s
প্রতিক্রিয়া সময় (মোট) 475.03s 988.58s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5 Mini 7.1 7.6 66.7% 1 13.86s 1,715 6,378
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 42,656 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5 Mini 10.0 10.0 100.0% 0 30.74s 580 12,544
Step 3.7 Flash 3.6 4.6 25.0% 1 126.82s 164,069 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5 Mini 10.0 10.0 100.0% 0 88.15s 754 11,520
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 8,802 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5 Mini 10.0 10.0 100.0% 0 12.58s 453 3,200
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 23,113 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5 Mini 3.6 7.2 22.2% 1 44.63s 293 14,016
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 410,502 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5 Mini 4.5 10.0 0.0% 0 13.50s 349 1,856
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 2,862 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5 Mini 10.0 10.0 100.0% 0 11.59s 310 3,968
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 2,010 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5 Mini 5.6 9.8 33.3% 0 15.20s 1,622 6,144
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 25,422 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5 Mini 10.0 10.0 100.0% 0 18.64s 487 1,600
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 1,172 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5 Mini 3.0 10.0 0.0% 0 9.99s 160 1,856
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 147,476 0

দ্রুত তুলনা

তুলনার জুটি বদলান