নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.4 vs StepFun: Step 3.7 Flash

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-03

মেট্রিক GPT-5.4 GPT-5.4 medium প্রকাশ: 2026-03-05 Step 3.7 Flash Step 3.7 Flash high প্রকাশ: 2026-05-29
স্কোর 7.9 7.2
র‍্যাঙ্ক #27 #66
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.5 8.6
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 75.0% 63.3%
অস্থির টেস্ট 4 3
মোট রান 60 60
প্রতি ফলাফলে খরচ 8.765 8.723
মোট খরচ $1.140 $0.960
ইনপুট মূল্য $2.500 / 1M $0.200 / 1M
আউটপুট মূল্য $15.000 / 1M $1.150 / 1M
মোট ইনপুট টোকেন 31,489 35,763
আউটপুট টোকেন 2,221 828,084
রিজনিং টোকেন 68,486 0
প্রতিক্রিয়া সময় (গড়) 22.31s 49.43s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 100.41s 192.75s
প্রতিক্রিয়া সময় (মোট) 446.17s 988.58s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 8.3 10.0 75.0% 0 4.11s 606 240 1,511
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 696 42,656 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 8.2 6.7 83.3% 1 54.98s 4,686 412 19,995
Step 3.7 Flash 3.7 8.3 0.0% 0 126.82s 3,429 164,069 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 10.0 10.0 100.0% 0 20.57s 11,019 301 3,543
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 13,638 8,802 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 10.0 10.0 100.0% 0 5.32s 7,140 234 804
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 7,368 23,113 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 5.3 7.2 44.4% 1 74.27s 619 61 34,748
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 783 410,502 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 4.7 3.1 33.3% 1 4.92s 477 145 321
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 510 2,862 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 10.0 10.0 100.0% 0 3.11s 660 93 897
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 705 2,010 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 8.2 7.2 88.9% 1 9.14s 642 441 3,815
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 711 25,422 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 10.0 10.0 100.0% 0 13.28s 5,445 264 1,031
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 7,701 1,172 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 3.0 10.0 0.0% 0 13.95s 195 30 1,821
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 222 147,476 0

দ্রুত তুলনা

তুলনার জুটি বদলান