নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.5 vs StepFun: Step 3.7 Flash

সারাংশ

GPT-5.5 vs Step 3.7 Flash benchmark তুলনা: Step 3.7 Flash average score-এ এগিয়ে: 7.0 vs 6.4. GPT-5.5-এর benchmark খরচ কম: $0.231 vs $1.148. GPT-5.5 দ্রুত: 1.89s vs 64.46s, pass rates 54.0% vs 63.5%.

প্রস্তাবিত মডেল: GPT-5.5 - Its score stays close to the best score here (6.4 vs 7.0), while costing about 5.0x less than Step 3.7 Flash.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-04

মেট্রিক GPT-5.5 GPT-5.5 none প্রকাশ: 2026-04-24 Step 3.7 Flash Step 3.7 Flash high প্রকাশ: 2026-05-29
স্কোর 6.4 7.0
র‍্যাঙ্ক #91 #71
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.8 8.2
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 54.0% 63.5%
অস্থির টেস্ট 3 4
মোট রান 63 63
প্রতি ফলাফলে খরচ 2.302 10.434
মোট খরচ $0.231 $1.148
ইনপুট মূল্য $5.000 / 1M $0.200 / 1M
আউটপুট মূল্য $30.000 / 1M $1.150 / 1M
মোট ইনপুট টোকেন 34,212 38,391
আউটপুট টোকেন 1,971 991,355
রিজনিং টোকেন 0 0
প্রতিক্রিয়া সময় (গড়) 1.89s 64.46s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 5.56s 364.99s
প্রতিক্রিয়া সময় (মোট) 39.64s 1353.57s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#91 GPT-5.5

none
Cost
$0.090
Time
54.3s
Tokens
3,063 tok

#71 Step 3.7 Flash

high
Cost
$0.007
Time
63.6s
Tokens
6,030 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 6.9 7.9 66.7% 1 1.31s 606 213 0
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 696 42,656 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 5.5 10.0 33.3% 0 1.35s 7,305 462 0
Step 3.7 Flash 4.0 6.0 22.2% 1 206.21s 6,057 327,340 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 3.0 10.0 0.0% 0 5.56s 11,019 300 0
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 13,638 8,802 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 10.0 10.0 100.0% 0 1.18s 7,140 222 0
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 7,368 23,113 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 2.9 7.2 11.1% 1 1.31s 723 52 0
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 783 410,502 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 10.0 10.0 100.0% 0 3.41s 477 124 0
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 510 2,862 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 6.2 5.8 66.7% 1 1.15s 660 81 0
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 705 2,010 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 7.7 10.0 66.7% 0 1.29s 642 252 0
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 711 25,422 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 10.0 10.0 100.0% 0 3.90s 5,445 247 0
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 7,701 1,172 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 3.0 10.0 0.0% 0 5.01s 195 18 0
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 222 147,476 0

দ্রুত তুলনা

তুলনার জুটি বদলান