AI BENCHY
Advertise here
#80

DeepSeek V4 Pro

DeepSeek প্রকাশ: 2026-04-24 পরীক্ষিত হয়েছে: 2026-05-22 00:54 deepseek/deepseek-v4-pro::high
(high) (none)

সারাংশ

DeepSeek V4 Pro AI BENCHY-তে 6.6 স্কোর করে এবং #80 স্থানে আছে। এর reliability 9.0, pass rate 66.7%, মোট খরচ $0.212, এবং গড় response time 58.93s.

ধারাবাহিকতা

8.3

মোট আউটপুট টোকেন

65,985

মোট ইনপুট টোকেন

0

ইনপুট মূল্য

$0.435 / 1M

আউটপুট মূল্য

$0.870 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 9

প্রতি চেষ্টায় পাস রেট: 66.7%

অস্থির টেস্ট

4

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

58.93s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 358.35s

প্রতিক্রিয়া সময় (মোট): 1119.75s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#80 DeepSeek V4 Pro

high
Cost
$0.023
Time
257.6s
Tokens
14,870 tok

রান ইতিহাস

পরীক্ষিত হয়েছে স্কোর নির্ভরযোগ্যতা সঠিক টেস্ট মোট খরচ তুলনা করুন
2026-06-04 14:38 নতুন টেস্ট যোগ হয়েছে 6.0 8.9 $0.079 তুলনা করুন
2026-05-22 00:54 স্যুইট পরিবর্তিত হয়েছে 6.6 9.0 $0.212 বর্তমান রান
2026-04-29 14:47 পুনরায় পরীক্ষা 7.5 9.3 $0.209 তুলনা করুন
2026-04-26 10:50 পুনরায় পরীক্ষা 7.5 8.4 $0.201 তুলনা করুন
2026-04-25 21:53 প্রথম রান 8.2 প্রযোজ্য নয় $0.329 তুলনা করুন

এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।

রান তুলনা

রানস্কোরধারাবাহিকতানির্ভরযোগ্যতাসঠিক টেস্টঅস্থির টেস্টমোট আউটপুট টোকেনমোট ইনপুট টোকেনমোট খরচপ্রতিক্রিয়া সময় (গড়)
2026-05-22 00:54 · স্যুইট পরিবর্তিত হয়েছে6.68.39.011/20465,9850$0.21258.93s
2026-04-26 10:50 · পুনরায় পরীক্ষা7.58.08.411/18457,8750$0.20160.02s
পার্থক্য-0.9+0.3+0.600+81100+$0.012-1083ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ স্কোর ধারাবাহিকতা সঠিক টেস্ট
অ্যান্টি-এআই কৌশল 7.4 10.0
কোডিং 2.8 5.0
সমন্বিত 10.0 10.0
ডেটা পার্সিং ও নিষ্কাশন 8.8 10.0
ডোমেইন-নির্দিষ্ট 3.0 6.9
Sadharon Buddhimotta 6.1 3.1
নির্দেশনা অনুসরণ 10.0 10.0
ধাঁধা সমাধান 7.4 7.2
টুল কলিং 10.0 10.0
সাধারণ জ্ঞান 3.0 10.0

তুলনা করা মডেল