নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.2 Chat vs StepFun: Step 3.7 Flash

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-05-29

মেট্রিক GPT-5.2 Chat GPT-5.2 Chat none প্রকাশ: 2025-12-11 Step 3.7 Flash Step 3.7 Flash medium প্রকাশ: 2026-05-29
স্কোর 7.9 7.9
র‍্যাঙ্ক #33 #32
নির্ভরযোগ্যতা 10.0 9.9
ধারাবাহিকতা 8.9 9.2
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 73.3% 71.7%
অস্থির টেস্ট 3 2
মোট রান 60 58
প্রতি ফলাফলে খরচ 2.703 2.663
মোট খরচ $0.352 $0.347
ইনপুট মূল্য $1.750 / 1M $0.200 / 1M
আউটপুট মূল্য $14.000 / 1M $1.150 / 1M
আউটপুট টোকেন 21,144 294,481
রিজনিং টোকেন 0 0
প্রতিক্রিয়া সময় (গড়) 6.82s 18.32s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 38.52s 113.98s
প্রতিক্রিয়া সময় (মোট) 136.34s 366.45s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 Chat 8.7 7.9 91.7% 1 3.40s 1,807 0
Step 3.7 Flash 8.7 7.9 91.7% 1 9.65s 32,185 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 Chat 8.2 6.7 83.3% 1 8.05s 4,131 0
Step 3.7 Flash 8.2 6.7 83.3% 1 10.64s 19,320 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 1,243 0
Step 3.7 Flash 10.0 10.0 100.0% 0 9.06s 7,106 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.05s 980 0
Step 3.7 Flash 10.0 10.0 100.0% 0 2.75s 3,020 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 Chat 5.3 10.0 33.3% 0 17.78s 7,810 0
Step 3.7 Flash 7.7 10.0 66.7% 0 48.27s 70,347 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 Chat 4.4 3.0 33.3% 1 3.20s 335 0
Step 3.7 Flash 4.0 10.0 0.0% 0 6.85s 3,987 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 Chat 9.8 10.0 100.0% 0 5.51s 1,441 0
Step 3.7 Flash 9.8 10.0 100.0% 0 1.83s 2,166 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 Chat 7.7 10.0 66.7% 0 4.10s 1,603 0
Step 3.7 Flash 5.7 9.9 33.3% 0 6.19s 15,071 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 555 0
Step 3.7 Flash 10.0 10.0 100.0% 0 4.16s 2,115 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 Chat 3.0 10.0 0.0% 0 6.89s 1,239 0
Step 3.7 Flash 3.0 10.0 0.0% 0 113.98s 139,164 0

দ্রুত তুলনা

তুলনার জুটি বদলান