নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.5 vs StepFun: Step 3.5 Flash

সারাংশ

GPT-5.5 vs Step 3.5 Flash benchmark তুলনা: Step 3.5 Flash average score-এ এগিয়ে: 6.6 vs 6.3. Step 3.5 Flash-এর benchmark খরচ কম: $0.070 vs $0.231. GPT-5.5 দ্রুত: 1.89s vs 72.53s, pass rates 54.0% vs 54.0%.

প্রস্তাবিত মডেল: Step 3.5 Flash - It has the best score here (6.6), while costing about 3.3x less than GPT-5.5.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-18

মেট্রিক GPT-5.5 GPT-5.5 none প্রকাশ: 2026-04-24 Step 3.5 Flash Step 3.5 Flash medium প্রকাশ: 2026-02-01
স্কোর 6.3 6.6
র‍্যাঙ্ক #90 #80
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.8 8.9
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 54.0% 54.0%
অস্থির টেস্ট 3 1
মোট রান 63 60
প্রতি ফলাফলে খরচ 2.302 0.198
মোট খরচ $0.231 $0.070
ইনপুট মূল্য $5.000 / 1M $0.090 / 1M
আউটপুট মূল্য $30.000 / 1M $0.300 / 1M
মোট ইনপুট টোকেন 34,212 34,431
আউটপুট টোকেন 1,971 91,587
রিজনিং টোকেন 0 195,973
প্রতিক্রিয়া সময় (গড়) 1.89s 72.53s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 5.56s 453.94s
প্রতিক্রিয়া সময় (মোট) 39.64s 1015.47s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#90 GPT-5.5

none
খরচ
$0.090
সময়
54.3s
টোকেন
3,063 tok

#80 Step 3.5 Flash

medium
খরচ
$0.008
সময়
277.1s
টোকেন
23,695 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 6.9 7.9 66.7% 1 1.31s 606 213 0
Step 3.5 Flash 10.0 10.0 100.0% 0 40.57s 694 20,391 24,176
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 5.5 10.0 33.3% 0 1.35s 7,305 462 0
Step 3.5 Flash 2.4 5.2 0.0% 0 258.38s 2,211 13,207 22,429
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 3.0 10.0 0.0% 0 5.56s 11,019 300 0
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 13,638 1,176 12,984
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 10.0 10.0 100.0% 0 1.18s 7,140 222 0
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 7,368 600 13,886
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 2.9 7.2 11.1% 1 1.31s 723 52 0
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 673 45,350 90,436
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 10.0 10.0 100.0% 0 3.41s 477 124 0
Step 3.5 Flash 5.5 10.0 0.0% 0 22.39s 509 240 3,506
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 6.2 5.8 66.7% 1 1.15s 660 81 0
Step 3.5 Flash 8.3 10.0 50.0% 0 4.78s 705 2,364 3,521
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 7.7 10.0 66.7% 0 1.29s 642 252 0
Step 3.5 Flash 5.3 10.0 33.3% 0 7.22s 711 5,630 10,861
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 10.0 10.0 100.0% 0 3.90s 5,445 247 0
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 7,701 275 3,802
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 3.0 10.0 0.0% 0 5.01s 195 18 0
Step 3.5 Flash 3.0 10.0 0.0% 0 108.45s 221 2,354 10,372

দ্রুত তুলনা

তুলনার জুটি বদলান