নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs OpenAI: GPT-5.4 Mini

সারাংশ

Claude Sonnet 4.6 vs GPT-5.4 Mini benchmark তুলনা: GPT-5.4 Mini average score-এ এগিয়ে: 8.0 vs 7.3. Claude Sonnet 4.6-এর benchmark খরচ কম: $0.316 vs $0.526. Claude Sonnet 4.6 দ্রুত: 5.04s vs 22.34s, pass rates 55.6% vs 73.0%.

প্রস্তাবিত মডেল: Claude Sonnet 4.6 - Its score stays close to the best score here (7.3 vs 8.0), while costing about 1.7x less than GPT-5.4 Mini.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-12

মেট্রিক Claude Sonnet 4.6 Claude Sonnet 4.6 none প্রকাশ: 2026-02-17 GPT-5.4 Mini GPT-5.4 Mini medium প্রকাশ: 2026-03-17
স্কোর 7.3 8.0
র‍্যাঙ্ক #57 #31
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.7 8.0
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 55.6% 73.0%
অস্থির টেস্ট 1 5
মোট রান 63 63
প্রতি ফলাফলে খরচ 2.870 4.381
মোট খরচ $0.316 $0.526
ইনপুট মূল্য $3.000 / 1M $0.750 / 1M
আউটপুট মূল্য $15.000 / 1M $4.500 / 1M
মোট ইনপুট টোকেন 57,886 34,116
আউটপুট টোকেন 9,465 2,181
রিজনিং টোকেন 0 108,937
প্রতিক্রিয়া সময় (গড়) 5.04s 22.34s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 23.84s 138.75s
প্রতিক্রিয়া সময় (মোট) 70.60s 469.20s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#57 Claude Sonnet 4.6

none
Cost
$0.038
Time
27.3s
Tokens
2,598 tok

#31 GPT-5.4 Mini

medium
Cost
$0.056
Time
95.5s
Tokens
12,464 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 636 1,214 0
GPT-5.4 Mini 8.6 7.9 91.7% 1 4.05s 606 296 2,876
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 5.5 10.0 33.3% 0 5.19s 8,522 2,127 0
GPT-5.4 Mini 8.4 7.4 88.9% 1 57.87s 7,305 467 40,902
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 26,024 3,766 0
GPT-5.4 Mini 10.0 10.0 100.0% 0 17.81s 11,019 317 4,317
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 8,574 252 0
GPT-5.4 Mini 10.0 10.0 100.0% 0 2.43s 7,140 234 650
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 759 413 0
GPT-5.4 Mini 4.1 4.4 44.5% 2 65.31s 619 60 43,286
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 513 192 0
GPT-5.4 Mini 4.5 10.0 0.0% 0 3.72s 477 150 510
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 690 90 0
GPT-5.4 Mini 9.8 10.0 100.0% 0 2.13s 660 96 1,185
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.53s 663 533 0
GPT-5.4 Mini 7.8 10.0 66.7% 0 4.37s 642 278 2,443
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 11,301 447 0
GPT-5.4 Mini 4.7 1.6 66.7% 1 9.62s 5,453 251 2,594
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 3.0 10.0 0.0% 0 4.67s 204 431 0
GPT-5.4 Mini 3.0 10.0 0.0% 0 30.10s 195 32 10,174

দ্রুত তুলনা

তুলনার জুটি বদলান