#165

DeepSeek V3.2

DeepSeek প্রকাশ: 2025-12-01 পরীক্ষিত হয়েছে: 2026-07-16 23:15 deepseek/deepseek-v3.2::none

(medium) (none)

সারাংশ

DeepSeek V3.2 AI BENCHY-তে 5.0 স্কোর করে এবং #165 স্থানে আছে। এর reliability 10.0, pass rate 37.9%, মোট খরচ $0.054, এবং গড় response time 18.25s.

DeepSeek V3.2 কে আলাদা করে যা: এটি সমন্বিত-তে সবচেয়ে ভালোভাবে নজর কাড়ে, যেখানে এর rank #1; আর কোডিং এর দুর্বলতম ক্ষেত্র, rank #14.

স্কোর

5.0

ধারাবাহিকতা

7.7

নির্ভরযোগ্যতা

10.0

মোট খরচ (বর্তমান মূল্য)

$0.054 ↑ +2.3%

পরীক্ষার সময়: $0.053

মোট আউটপুট টোকেন

42,097

মোট ইনপুট টোকেন

135,780

ইনপুট মূল্য

$0.269 / 1M

আউটপুট মূল্য

$0.400 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 16

প্রতি চেষ্টায় পাস রেট: 37.9%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

18.25s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 115.89s

প্রতিক্রিয়া সময় (মোট): 401.60s

ভুল উত্তর: 7 API ত্রুটি: 4 অতিরিক্ত ফরম্যাটিং: 2 অবৈধ টুল কল: 2 নির্দেশনা অনুসরণ করা হয়নি: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#165 DeepSeek V3.2

none

খরচ: $0.002
সময়: 7.0s
টোকেন: 1,046 tok

রান ইতিহাস

পরীক্ষিত হয়েছে	স্কোর	নির্ভরযোগ্যতা	মোট খরচ	তুলনা করুন
2026-07-16 23:15 নতুন টেস্ট যোগ হয়েছে	5.0	10.0	$0.054 ↑	বর্তমান রান
2026-06-04 14:22 নতুন টেস্ট যোগ হয়েছে	5.2	10.0	$0.017 ↓	তুলনা করুন
2026-05-22 00:35 স্যুইট পরিবর্তিত হয়েছে	5.6	10.0	$0.018	তুলনা করুন
2026-05-08 15:31 স্যুইট পরিবর্তিত হয়েছে	5.7	10.0	$0.016	তুলনা করুন
2026-04-20 17:48 প্রথম নথিভুক্ত রান	6.1	প্রযোজ্য নয়	$0.016	তুলনা করুন

এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।

রান তুলনা

রান	স্কোর	ধারাবাহিকতা	নির্ভরযোগ্যতা	সঠিক টেস্ট	অস্থির টেস্ট	মোট আউটপুট টোকেন	মোট ইনপুট টোকেন	মোট খরচ	প্রতিক্রিয়া সময় (গড়)
2026-07-16 23:15 · বর্তমান রান	5.0	7.7	10.0	6/22	6	42,097	135,780	$0.054	18.25s
2026-05-08 15:31 · স্যুইট পরিবর্তিত হয়েছে	5.7	7.9	10.0	7/19	5	7,194	0	$0.016	13.43s
পার্থক্য	-0.7	-0.2	0.0	-1	+1	+34903	+135780	+$0.039	+4828ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

মূল্যের ইতিহাস

OpenRouter থেকে এই মডেলের ঐতিহাসিক মূল্য তথ্য।

তারিখ	ইনপুট মূল্য	আউটপুট মূল্য
2026-06-04 15:40	$0.229 / 1M	$0.344 / 1M
2026-07-10 11:30	$0.215 / 1M	$0.322 / 1M
2026-07-16 15:36	$0.269 / 1M	$0.400 / 1M

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

DeepSeek V3.2nonevsQwen3.6 27Bnone DeepSeek V3.2nonevsMiMo-V2.5-Pronone DeepSeek V3.2nonevsGLM 5.1none DeepSeek V3.2nonevsKimi K2.5none DeepSeek V3.2nonevsDeepSeek V4 Flashnone DeepSeek V3.2nonevsGemma 4 26B A4Bnoneবিনামূল্যে উপলভ্য DeepSeek V3.2nonevsGemini 3 Flash Previewmedium DeepSeek V3.2nonevsGemini 3.5 Flashhigh DeepSeek V3.2nonevsNemotron 3 Ultramediumবিনামূল্যে উপলভ্য DeepSeek V3.2nonevsGPT-5.5low

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	3.2	8.0
কোডিং	3.1	6.9
সমন্বিত	4.8	10.0
ডেটা পার্সিং ও নিষ্কাশন	6.3	5.8
ডোমেইন-নির্দিষ্ট	2.9	7.2
Sadharon Buddhimotta	4.7	1.6
নির্দেশনা অনুসরণ	10.0	10.0
ধাঁধা সমাধান	7.6	7.2
টুল কলিং	10.0	10.0
সাধারণ জ্ঞান	3.0	10.0

DeepSeek V3.2

Hamster playing table tennis

#165 DeepSeek V3.2

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল