#32

GPT-5.2 Chat

OpenAI প্রকাশ: 2025-12-11 পরীক্ষিত হয়েছে: 2026-04-11 01:44 openai/gpt-5.2-chat::none

সারাংশ

GPT-5.2 Chat AI BENCHY-তে 7.9 স্কোর করে এবং #32 স্থানে আছে। এর reliability প্রযোজ্য নয়, pass rate 75.9%, মোট খরচ $0.291, এবং গড় response time 6.84s.

GPT-5.2 Chat কে আলাদা করে যা: একই ধরনের মডেলের তুলনায় এটি লক্ষণীয়ভাবে দ্রুত।

স্কোর

7.9

ধারাবাহিকতা

8.7

নির্ভরযোগ্যতা

প্রযোজ্য নয়

মোট খরচ (বর্তমান মূল্য)

$0.291

মোট আউটপুট টোকেন

17,346

মোট ইনপুট টোকেন

ইনপুট মূল্য

$1.750 / 1M

আউটপুট মূল্য

$14.000 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 6

প্রতি চেষ্টায় পাস রেট: 75.9%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

6.84s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 38.52s

প্রতিক্রিয়া সময় (মোট): 123.17s

ভুল উত্তর: 5 নির্দেশনা অনুসরণ করা হয়নি: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#32 GPT-5.2 Chat

none

খরচ: $0.010
সময়: 15.3s
টোকেন: 797 tok

রান ইতিহাস

পরীক্ষিত হয়েছে	স্কোর	নির্ভরযোগ্যতা	মোট খরচ	তুলনা করুন
2026-07-16 22:40 নতুন টেস্ট যোগ হয়েছে	8.0	10.0	$0.604	তুলনা করুন
2026-06-04 13:47 নতুন টেস্ট যোগ হয়েছে	7.9	10.0	$0.393	তুলনা করুন
2026-05-22 00:19 স্যুইট পরিবর্তিত হয়েছে	7.6	10.0	$0.355	তুলনা করুন
2026-04-11 01:44 প্রথম নথিভুক্ত রান	7.9	প্রযোজ্য নয়	$0.291	বর্তমান রান

রান তুলনা

রান	স্কোর	ধারাবাহিকতা	নির্ভরযোগ্যতা	সঠিক টেস্ট	অস্থির টেস্ট	মোট আউটপুট টোকেন	মোট খরচ	প্রতিক্রিয়া সময় (গড়)
2026-04-11 01:44 · প্রথম নথিভুক্ত রান	7.9	8.7	প্রযোজ্য নয়	12/18	3	17,346	$0.291	6.84s
2026-05-22 00:19 · স্যুইট পরিবর্তিত হয়েছে	7.6	8.5	10.0	12/20	4	21,371	$0.355	6.86s
পার্থক্য	+0.3	+0.2		0	-1	-4025	-$0.064	-16ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

GPT-5.2 ChatnonevsStep 3.7 Flashmedium GPT-5.2 ChatnonevsGLM 5.2high GPT-5.2 ChatnonevsMuse Spark 1.1high GPT-5.2 ChatnonevsKimi K3max GPT-5.2 ChatnonevsGPT-5 Minimedium GPT-5.2 ChatnonevsGPT-5.6 Terrahigh GPT-5.2 ChatnonevsGemini 3 Flash Previewmedium GPT-5.2 ChatnonevsGemini 3.5 Flashhigh GPT-5.2 ChatnonevsNemotron 3 Ultramediumবিনামূল্যে উপলভ্য GPT-5.2 ChatnonevsGPT-5.5low

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	8.7	7.9
কোডিং	10.0	10.0
সমন্বিত	10.0	10.0
ডেটা পার্সিং ও নিষ্কাশন	10.0	10.0
ডোমেইন-নির্দিষ্ট	5.3	10.0
Sadharon Buddhimotta	4.4	3.0
নির্দেশনা অনুসরণ	7.5	6.1
ধাঁধা সমাধান	7.7	10.0
টুল কলিং	10.0	10.0

GPT-5.2 Chat

Hamster playing table tennis

#32 GPT-5.2 Chat

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল