GPT-5.5

OpenAI প্রকাশ: 2026-04-24 পরীক্ষিত হয়েছে: 2026-04-24 20:23 openai/gpt-5.5::medium

(medium) (low) (none)

সারাংশ

GPT-5.5 AI BENCHY-তে 9.0 স্কোর করে এবং #5 স্থানে আছে। এর reliability প্রযোজ্য নয়, pass rate 87.0%, মোট খরচ $2.884, এবং গড় response time 32.75s.

GPT-5.5 কে আলাদা করে যা: এটি সামগ্রিকভাবে সর্বোচ্চ rank করা মডেলগুলোর একটি।

স্কোর

9.0

ধারাবাহিকতা

9.2

নির্ভরযোগ্যতা

প্রযোজ্য নয়

মোট খরচ (বর্তমান মূল্য)

$2.884

মোট আউটপুট টোকেন

91,552

মোট ইনপুট টোকেন

ইনপুট মূল্য

$5.000 / 1M

আউটপুট মূল্য

$30.000 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 3

প্রতি চেষ্টায় পাস রেট: 87.0%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

32.75s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 332.10s

প্রতিক্রিয়া সময় (মোট): 589.59s

ভুল উত্তর: 2 নির্দেশনা অনুসরণ করা হয়নি: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#5 GPT-5.5

medium

খরচ: $0.112
সময়: 71.9s
টোকেন: 3,807 tok

রান ইতিহাস

পরীক্ষিত হয়েছে	স্কোর	নির্ভরযোগ্যতা	মোট খরচ	তুলনা করুন
2026-07-16 22:37 নতুন টেস্ট যোগ হয়েছে	9.0	10.0	$4.137	তুলনা করুন
2026-06-04 13:48 নতুন টেস্ট যোগ হয়েছে	8.8	10.0	$3.679	তুলনা করুন
2026-05-22 00:21 স্যুইট পরিবর্তিত হয়েছে	8.7	10.0	$3.503	তুলনা করুন
2026-04-24 20:23 প্রথম রান	9.0	প্রযোজ্য নয়	$2.884	বর্তমান রান

রান তুলনা

রান	স্কোর	ধারাবাহিকতা	নির্ভরযোগ্যতা	সঠিক টেস্ট	অস্থির টেস্ট	মোট আউটপুট টোকেন	মোট ইনপুট টোকেন	মোট খরচ	প্রতিক্রিয়া সময় (গড়)
2026-04-24 20:23 · প্রথম রান	9.0	9.2	প্রযোজ্য নয়	15/18	2	91,552	0	$2.884	32.75s
2026-06-04 13:48 · নতুন টেস্ট যোগ হয়েছে	8.8	8.9	10.0	17/21	3	116,910	34,212	$3.679	37.98s
পার্থক্য	+0.2	+0.3		-2	-1	-25358	-34212	-$0.795	-5226ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

GPT-5.5mediumvsGemini 3.5 Flashmedium GPT-5.5mediumvsGemini 3.5 Flashlow GPT-5.5mediumvsQwen3.7 Maxmedium GPT-5.5mediumvsGrok 4.5high GPT-5.5mediumvsGemini 3.1 Pro Previewmedium GPT-5.5mediumvsGPT-5.3-Codexmedium GPT-5.5mediumvsGPT-5.5low GPT-5.5mediumvsClaude Opus 4.8medium GPT-5.5mediumvsGPT-5.6 Solhigh GPT-5.5mediumvsClaude Opus 4.7medium

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	10.0	10.0
কোডিং	10.0	10.0
সমন্বিত	10.0	10.0
ডেটা পার্সিং ও নিষ্কাশন	10.0	10.0
ডোমেইন-নির্দিষ্ট	5.3	7.2
Sadharon Buddhimotta	10.0	10.0
নির্দেশনা অনুসরণ	10.0	10.0
ধাঁধা সমাধান	8.6	7.9
টুল কলিং	10.0	10.0

GPT-5.5

Hamster playing table tennis

#5 GPT-5.5

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল