নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: gpt-oss-120b vs StepFun: Step 3.7 Flash

সারাংশ

gpt-oss-120b vs Step 3.7 Flash benchmark তুলনা: Step 3.7 Flash average score-এ এগিয়ে: 7.1 vs 6.7. gpt-oss-120b-এর benchmark খরচ কম: $0.013 vs $1.148. gpt-oss-120b দ্রুত: 22.28s vs 64.46s, pass rates 52.4% vs 63.5%.

প্রস্তাবিত মডেল: gpt-oss-120b - Its score stays close to the best score here (6.7 vs 7.1), while costing about 94.5x less than Step 3.7 Flash.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-18

মেট্রিক gpt-oss-120b gpt-oss-120b medium প্রকাশ: 2025-08-05 বিনামূল্যে উপলভ্য Step 3.7 Flash Step 3.7 Flash high প্রকাশ: 2026-05-29
স্কোর 6.7 7.1
র‍্যাঙ্ক #78 #63
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.0 8.2
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 52.4% 63.5%
অস্থির টেস্ট 5 4
মোট রান 63 63
প্রতি ফলাফলে খরচ 0.141 10.434
মোট খরচ $0.013 $1.148
ইনপুট মূল্য $0.039 / 1M $0.200 / 1M
আউটপুট মূল্য $0.180 / 1M $1.150 / 1M
মোট ইনপুট টোকেন 39,084 38,391
আউটপুট টোকেন 20,013 991,355
রিজনিং টোকেন 50,233 0
প্রতিক্রিয়া সময় (গড়) 22.28s 64.46s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 68.16s 364.99s
প্রতিক্রিয়া সময় (মোট) 311.96s 1353.57s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#78 gpt-oss-120b

medium
খরচ
$0.001
সময়
26.7s
টোকেন
555 tok

#63 Step 3.7 Flash

high
খরচ
$0.007
সময়
63.6s
টোকেন
6,030 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 1,314 3,518 2,177
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 696 42,656 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 5.9 7.0 55.6% 1 38.37s 7,782 3,365 11,973
Step 3.7 Flash 4.0 6.0 22.2% 1 206.21s 6,057 327,340 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 11,535 694 5,072
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 13,638 8,802 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 7,476 241 1,114
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 7,368 23,113 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 1,266 6,784 20,606
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 783 410,502 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 659 107 387
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 510 2,862 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 1,036 126 1,799
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 705 2,010 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 5.3 7.2 44.4% 1 21.71s 1,190 1,790 2,264
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 711 25,422 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 6,514 287 1,083
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 7,701 1,172 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 3.0 10.0 0.0% 0 26.51s 312 3,101 3,758
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 222 147,476 0

দ্রুত তুলনা

তুলনার জুটি বদলান