#13

GPT-5.5

OpenAI প্রকাশ: 2026-04-24 পরীক্ষিত হয়েছে: 2026-07-16 22:37 openai/gpt-5.5::medium

(medium) (low) (none)

সারাংশ

GPT-5.5 AI BENCHY-তে 9.0 স্কোর করে এবং #13 স্থানে আছে। এর reliability 10.0, pass rate 87.9%, মোট খরচ $4.137, এবং গড় response time 38.42s.

স্কোর

9.0

ধারাবাহিকতা

8.9

নির্ভরযোগ্যতা

10.0

মোট খরচ (বর্তমান মূল্য)

$4.137

মোট আউটপুট টোকেন

124,436

মোট ইনপুট টোকেন

80,659

ইনপুট মূল্য

$5.000 / 1M

আউটপুট মূল্য

$30.000 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 4

প্রতি চেষ্টায় পাস রেট: 87.9%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

38.42s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 332.10s

প্রতিক্রিয়া সময় (মোট): 845.35s

ভুল উত্তর: 4

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#13 GPT-5.5

medium

খরচ: $0.112
সময়: 71.9s
টোকেন: 3,807 tok

রান ইতিহাস

পরীক্ষিত হয়েছে	স্কোর	নির্ভরযোগ্যতা	মোট খরচ	তুলনা করুন
2026-07-16 22:37 নতুন টেস্ট যোগ হয়েছে	9.0	10.0	$4.137	বর্তমান রান
2026-06-04 13:48 নতুন টেস্ট যোগ হয়েছে	8.8	10.0	$3.679	তুলনা করুন
2026-05-22 00:21 স্যুইট পরিবর্তিত হয়েছে	8.7	10.0	$3.503	তুলনা করুন
2026-04-24 20:23 প্রথম রান	9.0	প্রযোজ্য নয়	$2.884	তুলনা করুন

এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।

রান তুলনা

রান	স্কোর	ধারাবাহিকতা	নির্ভরযোগ্যতা	সঠিক টেস্ট	অস্থির টেস্ট	মোট আউটপুট টোকেন	মোট ইনপুট টোকেন	মোট খরচ	প্রতিক্রিয়া সময় (গড়)
2026-07-16 22:37 · বর্তমান রান	9.0	8.9	10.0	18/22	3	124,436	80,659	$4.137	38.42s
2026-04-24 20:23 · প্রথম রান	9.0	9.2	প্রযোজ্য নয়	15/18	2	91,552	0	$2.884	32.75s
পার্থক্য	0.0	-0.3		+3	+1	+32884	+80659	+$1.253	+5670ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

মূল্যের ইতিহাস

OpenRouter থেকে এই মডেলের ঐতিহাসিক মূল্য তথ্য।

তারিখ	ইনপুট মূল্য	আউটপুট মূল্য
2026-06-04 15:40	$5.000 / 1M	$30.000 / 1M

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

GPT-5.5mediumvsGemini 3.5 Flashmedium GPT-5.5mediumvsGemini 3.5 Flashlow GPT-5.5mediumvsQwen3.7 Maxmedium GPT-5.5mediumvsGrok 4.5high GPT-5.5mediumvsGemini 3.1 Pro Previewmedium GPT-5.5mediumvsGPT-5.3-Codexmedium GPT-5.5mediumvsGPT-5.5low GPT-5.5mediumvsClaude Opus 4.8medium GPT-5.5mediumvsGPT-5.6 Solhigh GPT-5.5mediumvsClaude Opus 4.7medium

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	10.0	10.0
কোডিং	8.8	7.8
সমন্বিত	10.0	10.0
ডেটা পার্সিং ও নিষ্কাশন	10.0	10.0
ডোমেইন-নির্দিষ্ট	5.3	7.2
Sadharon Buddhimotta	10.0	10.0
নির্দেশনা অনুসরণ	10.0	10.0
ধাঁধা সমাধান	10.0	10.0
টুল কলিং	10.0	10.0
সাধারণ জ্ঞান	2.8	1.6

GPT-5.5

Hamster playing table tennis

#13 GPT-5.5

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল