নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.5 vs OpenAI: gpt-oss-120b

সারাংশ

GPT-5.5 vs gpt-oss-120b benchmark তুলনা: GPT-5.5 average score-এ এগিয়ে: 9.3 vs 6.7. gpt-oss-120b-এর benchmark খরচ কম: $0.011 vs $0.907. GPT-5.5 দ্রুত: 9.76s vs 22.28s, pass rates 85.7% vs 52.4%.

প্রস্তাবিত মডেল: GPT-5.5 - It has the best score here (9.3), while responding about 2.3x faster than gpt-oss-120b.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-07-02

মেট্রিক GPT-5.5 GPT-5.5 low প্রকাশ: 2026-04-24 gpt-oss-120b gpt-oss-120b medium প্রকাশ: 2025-08-05 বিনামূল্যে উপলভ্য
স্কোর 9.3 6.7
র‍্যাঙ্ক #4 #81
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 10.0 8.0
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 85.7% 52.4%
অস্থির টেস্ট 0 5
মোট রান 63 63
প্রতি ফলাফলে খরচ 5.035 0.141
মোট খরচ $0.907 $0.011
ইনপুট মূল্য $5.000 / 1M $0.030 / 1M
আউটপুট মূল্য $30.000 / 1M $0.150 / 1M
মোট ইনপুট টোকেন 34,209 39,084
আউটপুট টোকেন 2,046 20,013
রিজনিং টোকেন 22,460 50,233
প্রতিক্রিয়া সময় (গড়) 9.76s 22.28s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 56.19s 68.16s
প্রতিক্রিয়া সময় (মোট) 204.92s 311.96s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#4 GPT-5.5

low
খরচ
$0.068
সময়
37.0s
টোকেন
2,339 tok

#81 gpt-oss-120b

medium
খরচ
$0.001
সময়
26.7s
টোকেন
555 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 10.0 10.0 100.0% 0 4.41s 606 238 1,020
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 1,314 3,518 2,177
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 10.0 10.0 100.0% 0 15.04s 7,302 423 6,402
gpt-oss-120b 5.9 7.0 55.6% 1 38.37s 7,782 3,365 11,973
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 10.0 10.0 100.0% 0 9.56s 11,019 303 717
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 11,535 694 5,072
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 10.0 10.0 100.0% 0 3.28s 7,140 228 157
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 7,476 241 1,114
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 5.3 10.0 33.3% 0 28.05s 723 69 11,609
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 1,266 6,784 20,606
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 10.0 10.0 100.0% 0 5.17s 477 133 245
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 659 107 387
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 9.9 10.0 100.0% 0 3.74s 660 93 415
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 1,036 126 1,799
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 10.0 10.0 100.0% 0 4.74s 642 279 954
gpt-oss-120b 5.3 7.2 44.4% 1 21.71s 1,190 1,790 2,264
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 10.0 10.0 100.0% 0 4.96s 5,445 250 101
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 6,514 287 1,083
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 3.0 10.0 0.0% 0 10.06s 195 30 840
gpt-oss-120b 3.0 10.0 0.0% 0 26.51s 312 3,101 3,758

দ্রুত তুলনা

তুলনার জুটি বদলান