নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs OpenAI: GPT-5.3 Chat

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-02

মেট্রিক Claude Sonnet 4.6 Claude Sonnet 4.6 medium প্রকাশ: 2026-02-17 GPT-5.3 Chat GPT-5.3 Chat none প্রকাশ: 2026-03-03
স্কোর 7.6 7.4
র‍্যাঙ্ক #52 #57
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.2 8.4
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 68.3% 68.3%
অস্থির টেস্ট 2 4
মোট রান 60 60
প্রতি ফলাফলে খরচ 10.229 3.350
মোট খরচ $1.330 $0.402
ইনপুট মূল্য $3.000 / 1M $1.750 / 1M
আউটপুট মূল্য $15.000 / 1M $14.000 / 1M
মোট ইনপুট টোকেন 45,947 31,590
আউটপুট টোকেন 49,891 24,757
রিজনিং টোকেন 29,565 0
প্রতিক্রিয়া সময় (গড়) 15.81s 6.13s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 46.35s 18.33s
প্রতিক্রিয়া সময় (মোট) 189.71s 122.61s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 6.5 10.0 50.0% 0 2.98s 789 1,046 1,093
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 606 3,167 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 6.9 6.0 66.7% 1 33.87s 3,830 11,277 3,281
GPT-5.3 Chat 6.9 6.2 66.7% 1 10.52s 4,683 4,772 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 46.35s 18,351 5,871 3,962
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 11,019 2,614 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 13.90s 8,676 649 742
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 7,140 942 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 2.9 7.2 11.1% 1 0ms 471 25,790 16,919
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 723 8,264 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.94s 564 256 433
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 477 319 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 2.61s 792 318 552
GPT-5.3 Chat 9.8 10.0 100.0% 0 3.51s 660 1,491 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 5.31s 816 592 646
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.99s 642 1,758 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 7.48s 11,454 655 351
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 5,445 861 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 3.0 10.0 0.0% 0 30.09s 204 3,437 1,586
GPT-5.3 Chat 3.0 10.0 0.0% 0 4.38s 195 569 0

দ্রুত তুলনা

তুলনার জুটি বদলান