AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com
#103

DeepSeek V4 Pro

DeepSeek প্রকাশ: 2026-04-24 পরীক্ষিত হয়েছে: 2026-06-04 14:38 deepseek/deepseek-v4-pro::high
(high) (none)

সারাংশ

DeepSeek V4 Pro AI BENCHY-তে 6.0 স্কোর করে এবং #103 স্থানে আছে। এর reliability 9.0, pass rate 52.4%, মোট খরচ $0.079, এবং গড় response time 65.21s.

DeepSeek V4 Pro কে আলাদা করে যা: এটি সমন্বিত-তে সবচেয়ে ভালোভাবে নজর কাড়ে, যেখানে এর rank #1; আর কোডিং এর দুর্বলতম ক্ষেত্র, rank #11. এটি অস্বাভাবিকভাবে বেশি reasoning tokens ব্যবহার করে, যা ধীর বা বেশি খরচের runs ব্যাখ্যা করতে পারে।

ধারাবাহিকতা

7.6

মোট খরচ (বর্তমান মূল্য)

$0.079 ↓ -65.9%

পরীক্ষার সময়: $0.230

মোট আউটপুট টোকেন

84,507

মোট ইনপুট টোকেন

32,240

ইনপুট মূল্য

$0.435 / 1M

আউটপুট মূল্য

$0.870 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 13

প্রতি চেষ্টায় পাস রেট: 52.4%

অস্থির টেস্ট

6

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

65.21s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 358.35s

প্রতিক্রিয়া সময় (মোট): 1304.19s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#103 DeepSeek V4 Pro

high
Cost
$0.023
Time
257.6s
Tokens
14,870 tok

রান ইতিহাস

পরীক্ষিত হয়েছে স্কোর নির্ভরযোগ্যতা সঠিক টেস্ট মোট খরচ তুলনা করুন
2026-06-04 14:38 নতুন টেস্ট যোগ হয়েছে 6.0 8.9 $0.079 বর্তমান রান
2026-05-22 00:54 স্যুইট পরিবর্তিত হয়েছে 6.6 9.0 $0.212 তুলনা করুন
2026-04-29 14:47 পুনরায় পরীক্ষা 7.5 9.3 $0.209 তুলনা করুন
2026-04-26 10:50 পুনরায় পরীক্ষা 7.5 8.4 $0.201 তুলনা করুন
2026-04-25 21:53 প্রথম রান 8.2 প্রযোজ্য নয় $0.329 তুলনা করুন

এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।

মূল্যের ইতিহাস

OpenRouter থেকে এই মডেলের ঐতিহাসিক মূল্য তথ্য।

তারিখ ইনপুট মূল্য আউটপুট মূল্য
2026-06-04 15:40 $0.435 / 1M $0.870 / 1M

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ স্কোর ধারাবাহিকতা সঠিক টেস্ট
অ্যান্টি-এআই কৌশল 6.4 7.9
কোডিং 3.3 6.4
সমন্বিত 10.0 10.0
ডেটা পার্সিং ও নিষ্কাশন 7.3 5.9
ডোমেইন-নির্দিষ্ট 2.9 7.2
Sadharon Buddhimotta 6.1 3.1
নির্দেশনা অনুসরণ 10.0 10.0
ধাঁধা সমাধান 5.9 7.2
টুল কলিং 10.0 10.0
সাধারণ জ্ঞান 3.0 10.0

তুলনা করা মডেল