নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs OpenAI: GPT-5.4 Nano

সারাংশ

DeepSeek V4 Pro vs GPT-5.4 Nano benchmark তুলনা: GPT-5.4 Nano average score-এ এগিয়ে: 7.5 vs 7.2. DeepSeek V4 Pro-এর benchmark খরচ কম: $0.030 vs $0.107. DeepSeek V4 Pro দ্রুত: 5.30s vs 11.95s, pass rates 52.4% vs 63.5%.

প্রস্তাবিত মডেল: DeepSeek V4 Pro - Its score stays close to the best score here (7.2 vs 7.5), while costing about 3.6x less than GPT-5.4 Nano.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-12

মেট্রিক DeepSeek V4 Pro DeepSeek V4 Pro none প্রকাশ: 2026-04-24 GPT-5.4 Nano GPT-5.4 Nano medium প্রকাশ: 2026-03-17
স্কোর 7.2 7.5
র‍্যাঙ্ক #61 #49
নির্ভরযোগ্যতা 9.9 10.0
ধারাবাহিকতা 8.8 8.4
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 52.4% 63.5%
অস্থির টেস্ট 3 4
মোট রান 61 63
প্রতি ফলাফলে খরচ 0.293 0.969
মোট খরচ $0.030 $0.107
ইনপুট মূল্য $0.435 / 1M $0.200 / 1M
আউটপুট মূল্য $0.870 / 1M $1.250 / 1M
মোট ইনপুট টোকেন 53,078 35,434
আউটপুট টোকেন 7,047 3,014
রিজনিং টোকেন 0 76,520
প্রতিক্রিয়া সময় (গড়) 5.30s 11.95s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 23.74s 94.06s
প্রতিক্রিয়া সময় (মোট) 111.39s 250.98s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#61 DeepSeek V4 Pro

none
Invalid SVG
Cost
$0.000
Time
300.0s
Tokens
0 tok

#49 GPT-5.4 Nano

medium
Cost
$0.007
Time
24.6s
Tokens
4,943 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 3.2 6.1 16.7% 2 4.02s 540 1,168 0
GPT-5.4 Nano 8.3 10.0 75.0% 0 4.52s 606 683 2,254
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 5.6 10.0 33.3% 0 5.62s 6,795 1,123 0
GPT-5.4 Nano 6.1 4.7 66.7% 2 19.12s 7,305 516 20,778
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 9.5 10.0 100.0% 0 23.74s 27,529 2,235 0
GPT-5.4 Nano 9.8 10.0 100.0% 0 24.13s 12,345 349 5,719
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 10.0 10.0 100.0% 0 4.61s 7,568 200 0
GPT-5.4 Nano 10.0 10.0 100.0% 0 2.54s 7,140 234 516
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 5.3 10.0 33.3% 0 3.72s 666 24 0
GPT-5.4 Nano 5.9 7.2 55.6% 1 38.18s 619 60 43,325
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 5.0 10.0 0.0% 0 2.05s 471 126 0
GPT-5.4 Nano 4.5 10.0 0.0% 0 4.15s 477 179 443
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 6.3 5.8 66.7% 1 4.12s 627 713 0
GPT-5.4 Nano 9.8 10.0 100.0% 0 1.88s 660 95 521
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 10.0 10.0 100.0% 0 3.61s 594 442 0
GPT-5.4 Nano 4.1 7.2 22.2% 1 3.79s 642 594 1,408
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 10.0 10.0 100.0% 0 7.40s 8,105 328 0
GPT-5.4 Nano 10.0 10.0 100.0% 0 7.71s 5,445 234 382
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 3.0 10.0 0.0% 0 5.76s 183 688 0
GPT-5.4 Nano 3.0 10.0 0.0% 0 4.81s 195 70 1,174

দ্রুত তুলনা

তুলনার জুটি বদলান