#68

DeepSeek V3.2

DeepSeek প্রকাশ: 2025-12-01 পরীক্ষিত হয়েছে: 2026-06-04 14:41 deepseek/deepseek-v3.2::medium

(medium) (none)

সারাংশ

DeepSeek V3.2 AI BENCHY-তে 7.5 স্কোর করে এবং #68 স্থানে আছে। এর reliability 10.0, pass rate 65.1%, মোট খরচ $0.052, এবং গড় response time 68.71s.

স্কোর

7.5

ধারাবাহিকতা

7.6

নির্ভরযোগ্যতা

10.0

মোট খরচ (বর্তমান মূল্য)

$0.052 ↑ +6.9%

পরীক্ষার সময়: $0.048

মোট আউটপুট টোকেন

106,267

মোট ইনপুট টোকেন

38,333

ইনপুট মূল্য

$0.269 / 1M

আউটপুট মূল্য

$0.400 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 10

প্রতি চেষ্টায় পাস রেট: 65.1%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

68.71s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 376.10s

প্রতিক্রিয়া সময় (মোট): 1442.81s

ভুল উত্তর: 5 API ত্রুটি: 2 টাইমআউট: 2 নির্দেশনা অনুসরণ করা হয়নি: 1

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#68 DeepSeek V3.2

medium

খরচ: $0.001
সময়: 53.6s
টোকেন: 1,932 tok

রান ইতিহাস

পরীক্ষিত হয়েছে	স্কোর	নির্ভরযোগ্যতা	মোট খরচ	তুলনা করুন
2026-06-04 14:41 নতুন টেস্ট যোগ হয়েছে	7.0	10.0	$0.044 ↓	বর্তমান রান
2026-05-22 00:46 স্যুইট পরিবর্তিত হয়েছে	7.0	9.1	$0.037	তুলনা করুন
2026-05-08 15:27 স্যুইট পরিবর্তিত হয়েছে	7.2	10.0	$0.031	তুলনা করুন
2026-04-20 17:48 প্রথম নথিভুক্ত রান	8.0	প্রযোজ্য নয়	$0.029	তুলনা করুন

এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।

রান তুলনা

রান	স্কোর	ধারাবাহিকতা	নির্ভরযোগ্যতা	সঠিক টেস্ট	অস্থির টেস্ট	মোট আউটপুট টোকেন	মোট ইনপুট টোকেন	মোট খরচ	প্রতিক্রিয়া সময় (গড়)
2026-06-04 14:41 · বর্তমান রান	7.5	7.6	10.0	11/21	6	106,267	38,333	$0.052	68.71s
2026-04-20 17:48 · প্রথম নথিভুক্ত রান	8.0	8.2	প্রযোজ্য নয়	12/18	4	59,131	0	$0.029	46.41s
পার্থক্য	-0.5	-0.6		-1	+2	+47136	+38333	+$0.023	+22298ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

মূল্যের ইতিহাস

OpenRouter থেকে এই মডেলের ঐতিহাসিক মূল্য তথ্য।

তারিখ	ইনপুট মূল্য	আউটপুট মূল্য
2026-06-04 15:40	$0.229 / 1M	$0.344 / 1M
2026-07-10 11:30	$0.215 / 1M	$0.322 / 1M
2026-07-16 15:36	$0.269 / 1M	$0.400 / 1M

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

DeepSeek V3.2mediumvsGPT-5.4 Nanomedium DeepSeek V3.2mediumvsGPT-5.3 Chatnone DeepSeek V3.2mediumvsKAT-Coder-Pro V2.5medium DeepSeek V3.2mediumvsSeed-2.0-Minimedium DeepSeek V3.2mediumvsGemini 3.5 Flashhigh DeepSeek V3.2mediumvsGemini 3 Flash Previewmedium DeepSeek V3.2mediumvsNemotron 3 Ultra 550b A55bmediumবিনামূল্যে উপলভ্য DeepSeek V3.2mediumvsGPT-5.5low

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	8.2	7.9
কোডিং	6.0	7.2
সমন্বিত	10.0	10.0
ডেটা পার্সিং ও নিষ্কাশন	10.0	10.0
ডোমেইন-নির্দিষ্ট	2.9	4.4
Sadharon Buddhimotta	3.4	2.5
নির্দেশনা অনুসরণ	10.0	10.0
ধাঁধা সমাধান	7.0	7.2
টুল কলিং	10.0	10.0
সাধারণ জ্ঞান	3.0	10.0

DeepSeek V3.2

Hamster playing table tennis

#68 DeepSeek V3.2

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল