নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.5 vs StepFun: Step 3.7 Flash

সারাংশ

GPT-5.5 vs Step 3.7 Flash benchmark তুলনা: GPT-5.5 average score-এ এগিয়ে: 9.0 vs 7.1. Step 3.7 Flash-এর benchmark খরচ কম: $1.148 vs $3.679. GPT-5.5 দ্রুত: 37.98s vs 64.46s, pass rates 87.3% vs 63.5%.

প্রস্তাবিত মডেল: GPT-5.5 - It has the best score here (9.0), while responding about 1.7x faster than Step 3.7 Flash.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-18

মেট্রিক GPT-5.5 GPT-5.5 medium প্রকাশ: 2026-04-24 Step 3.7 Flash Step 3.7 Flash high প্রকাশ: 2026-05-29
স্কোর 9.0 7.1
র‍্যাঙ্ক #9 #63
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.9 8.2
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 87.3% 63.5%
অস্থির টেস্ট 3 4
মোট রান 63 63
প্রতি ফলাফলে খরচ 21.638 10.434
মোট খরচ $3.679 $1.148
ইনপুট মূল্য $5.000 / 1M $0.200 / 1M
আউটপুট মূল্য $30.000 / 1M $1.150 / 1M
মোট ইনপুট টোকেন 34,212 38,391
আউটপুট টোকেন 1,985 991,355
রিজনিং টোকেন 114,925 0
প্রতিক্রিয়া সময় (গড়) 37.98s 64.46s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 332.10s 364.99s
প্রতিক্রিয়া সময় (মোট) 797.60s 1353.57s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#9 GPT-5.5

medium
খরচ
$0.112
সময়
71.9s
টোকেন
3,807 tok

#63 Step 3.7 Flash

high
খরচ
$0.007
সময়
63.6s
টোকেন
6,030 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 10.0 10.0 100.0% 0 4.66s 606 250 1,335
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 696 42,656 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 8.8 7.8 88.9% 1 59.77s 7,305 362 24,959
Step 3.7 Flash 4.0 6.0 22.2% 1 206.21s 6,057 327,340 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 10.0 10.0 100.0% 0 19.29s 11,019 312 2,841
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 13,638 8,802 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 10.0 10.0 100.0% 0 4.18s 7,140 234 593
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 7,368 23,113 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 5.3 7.2 44.4% 1 164.14s 723 67 79,625
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 783 410,502 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 10.0 10.0 100.0% 0 4.16s 477 138 223
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 510 2,862 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 10.0 10.0 100.0% 0 3.36s 660 93 538
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 705 2,010 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 10.0 10.0 100.0% 0 6.76s 642 241 2,225
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 711 25,422 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 10.0 10.0 100.0% 0 10.57s 5,445 258 832
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 7,701 1,172 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 2.8 1.6 33.3% 1 37.86s 195 30 1,754
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 222 147,476 0

দ্রুত তুলনা

তুলনার জুটি বদলান