নেভিগেশন
AI BENCHY
Your ad here

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs OpenAI: GPT-5.4

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-15

মেট্রিক Claude Sonnet 4.6 Claude Sonnet 4.6 medium প্রকাশ: 2026-02-17 GPT-5.4 GPT-5.4 medium প্রকাশ: 2026-03-05
র‍্যাঙ্ক #12 #9
স্কোর 8.3 8.5
ধারাবাহিকতা 9.5 8.5
প্রতি ফলাফলে খরচ 8.525 6.601
মোট খরচ $1.023 $0.793
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 77.1% 83.3%
অস্থির টেস্ট 1 3
মোট রান 48 48
আউটপুট টোকেন 35,159 1,756
রিজনিং টোকেন 24,687 46,642
প্রতিক্রিয়া সময় (গড়) 11.23s 20.05s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 46.35s 100.41s
প্রতিক্রিয়া সময় (মোট) 89.84s 320.87s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 7.7 10.0 66.7% 0 4.95s 1,031 1,093
GPT-5.4 10.0 10.0 100.0% 0 5.02s 216 1,466
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 46.35s 5,871 3,962
GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 13.90s 649 742
GPT-5.4 10.0 10.0 100.0% 0 5.32s 234 804
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 2.9 7.2 11.1% 1 0ms 25,790 16,919
GPT-5.4 5.3 7.2 44.4% 1 74.27s 61 34,748
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.94s 256 433
GPT-5.4 4.7 3.1 33.3% 1 4.92s 145 321
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 2.61s 318 552
GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.80s 589 635
GPT-5.4 8.2 7.2 88.9% 1 9.13s 442 3,832
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 7.48s 655 351
GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031

দ্রুত তুলনা

তুলনার জুটি বদলান