নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Sonnet 5 vs DeepSeek: DeepSeek V4 Pro

সারাংশ

Claude Sonnet 5 vs DeepSeek V4 Pro benchmark তুলনা: Claude Sonnet 5 average score-এ এগিয়ে: 7.9 vs 7.2. DeepSeek V4 Pro-এর benchmark খরচ কম: $0.034 vs $0.550. DeepSeek V4 Pro দ্রুত: 6.41s vs 9.94s, pass rates 79.4% vs 52.4%.

প্রস্তাবিত মডেল: DeepSeek V4 Pro - Its score stays close to the best score here (7.2 vs 7.9), while costing about 16.5x less than Claude Sonnet 5.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-30

মেট্রিক Claude Sonnet 5 Claude Sonnet 5 medium প্রকাশ: 2026-06-30 DeepSeek V4 Pro DeepSeek V4 Pro none প্রকাশ: 2026-04-24
স্কোর 7.9 7.2
র‍্যাঙ্ক #30 #60
নির্ভরযোগ্যতা 10.0 9.9
ধারাবাহিকতা 9.0 8.8
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 79.4% 52.4%
অস্থির টেস্ট 3 3
মোট রান 63 63
প্রতি ফলাফলে খরচ 3.662 0.333
মোট খরচ $0.550 $0.034
ইনপুট মূল্য $2.000 / 1M $0.435 / 1M
আউটপুট মূল্য $10.000 / 1M $0.870 / 1M
মোট ইনপুট টোকেন 67,416 53,558
আউটপুট টোকেন 34,012 11,424
রিজনিং টোকেন 7,673 0
প্রতিক্রিয়া সময় (গড়) 9.94s 6.41s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 56.94s 30.09s
প্রতিক্রিয়া সময় (মোট) 208.71s 134.66s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#30 Claude Sonnet 5

medium
খরচ
$0.007
সময়
6.4s
টোকেন
832 tok

#60 DeepSeek V4 Pro

none
অবৈধ SVG
খরচ
$0.000
সময়
300.0s
টোকেন
0 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 5 10.0 10.0 100.0% 0 3.80s 834 1,220 446
DeepSeek V4 Pro 3.2 6.1 16.7% 2 4.02s 540 1,168 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 5 9.0 7.9 88.9% 1 17.28s 10,590 13,153 2,379
DeepSeek V4 Pro 5.6 10.0 33.3% 0 13.38s 7,275 5,500 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 5 4.5 2.1 66.7% 1 37.01s 29,394 4,848 2,170
DeepSeek V4 Pro 9.5 10.0 100.0% 0 23.74s 27,529 2,235 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 5 10.0 10.0 100.0% 0 3.16s 10,503 312 0
DeepSeek V4 Pro 10.0 10.0 100.0% 0 4.61s 7,568 200 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 5 7.7 10.0 66.7% 0 20.38s 975 12,140 1,994
DeepSeek V4 Pro 5.3 10.0 33.3% 0 3.72s 666 24 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 5 4.8 3.2 33.3% 1 4.32s 708 264 0
DeepSeek V4 Pro 5.0 10.0 0.0% 0 2.05s 471 126 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 5 9.9 10.0 100.0% 0 3.10s 909 318 269
DeepSeek V4 Pro 6.3 5.8 66.7% 1 4.12s 627 713 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 5 7.7 10.0 66.7% 0 2.98s 894 407 121
DeepSeek V4 Pro 10.0 10.0 100.0% 0 3.61s 594 442 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 5 10.0 10.0 100.0% 0 10.70s 12,351 433 90
DeepSeek V4 Pro 10.0 10.0 100.0% 0 7.40s 8,105 328 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 5 3.0 10.0 0.0% 0 7.06s 258 917 204
DeepSeek V4 Pro 3.0 10.0 0.0% 0 5.76s 183 688 0

দ্রুত তুলনা

তুলনার জুটি বদলান