নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.2 vs StepFun: Step 3.7 Flash

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-05-29

মেট্রিক GPT-5.2 GPT-5.2 medium প্রকাশ: 2025-12-11 Step 3.7 Flash Step 3.7 Flash low প্রকাশ: 2026-05-29
স্কোর 7.3 7.4
র‍্যাঙ্ক #63 #60
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.3 8.7
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 70.0% 68.3%
অস্থির টেস্ট 4 3
মোট রান 60 60
প্রতি ফলাফলে খরচ 4.094 2.796
মোট খরচ $0.492 $0.336
ইনপুট মূল্য $1.750 / 1M $0.200 / 1M
আউটপুট মূল্য $14.000 / 1M $1.150 / 1M
আউটপুট টোকেন 2,880 285,209
রিজনিং টোকেন 28,289 0
প্রতিক্রিয়া সময় (গড়) 16.50s 16.06s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 77.80s 124.75s
প্রতিক্রিয়া সময় (মোট) 214.45s 321.11s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 6.5 8.0 58.3% 1 7.81s 567 2,002
Step 3.7 Flash 8.7 7.9 91.7% 1 4.02s 10,896 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 10.0 10.0 100.0% 0 23.15s 490 8,269
Step 3.7 Flash 10.0 10.0 100.0% 0 9.43s 14,569 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 10.0 10.0 100.0% 0 14.06s 291 1,757
Step 3.7 Flash 10.0 10.0 100.0% 0 7.98s 6,426 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 10.0 10.0 100.0% 0 3.15s 234 420
Step 3.7 Flash 7.3 5.8 83.3% 1 2.29s 2,667 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 5.9 7.2 55.6% 1 77.80s 42 10,342
Step 3.7 Flash 5.3 7.2 44.4% 1 43.31s 104,487 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 3.7 9.7 0.0% 0 4.32s 162 269
Step 3.7 Flash 3.4 9.3 0.0% 0 7.00s 4,604 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 9.9 10.0 100.0% 0 3.12s 94 614
Step 3.7 Flash 9.8 10.0 100.0% 0 1.58s 1,857 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 7.5 7.3 77.8% 1 5.80s 735 924
Step 3.7 Flash 5.5 9.9 33.3% 0 1.84s 3,564 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 4.7 1.6 66.7% 1 10.30s 239 469
Step 3.7 Flash 10.0 10.0 100.0% 0 3.25s 1,360 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 3.0 10.0 0.0% 0 28.18s 26 3,223
Step 3.7 Flash 3.0 10.0 0.0% 0 124.75s 134,779 0

দ্রুত তুলনা

তুলনার জুটি বদলান