নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs OpenAI: GPT-5.5

সারাংশ

Claude Sonnet 4.6 vs GPT-5.5 benchmark তুলনা: GPT-5.5 average score-এ এগিয়ে: 9.3 vs 7.8. GPT-5.5-এর benchmark খরচ কম: $0.907 vs $1.418. GPT-5.5 দ্রুত: 9.76s vs 17.06s, pass rates 65.1% vs 85.7%.

প্রস্তাবিত মডেল: GPT-5.5 - It has the best score here (9.3), while costing about 1.6x less than Claude Sonnet 4.6.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-07-02

মেট্রিক Claude Sonnet 4.6 Claude Sonnet 4.6 medium প্রকাশ: 2026-02-17 GPT-5.5 GPT-5.5 low প্রকাশ: 2026-04-24
স্কোর 7.8 9.3
র‍্যাঙ্ক #32 #4
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.1 10.0
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 65.1% 85.7%
অস্থির টেস্ট 2 0
মোট রান 63 63
প্রতি ফলাফলে খরচ 10.904 5.035
মোট খরচ $1.418 $0.907
ইনপুট মূল্য $3.000 / 1M $5.000 / 1M
আউটপুট মূল্য $15.000 / 1M $30.000 / 1M
মোট ইনপুট টোকেন 49,112 34,209
আউটপুট টোকেন 54,703 2,046
রিজনিং টোকেন 29,970 22,460
প্রতিক্রিয়া সময় (গড়) 17.06s 9.76s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 46.35s 56.19s
প্রতিক্রিয়া সময় (মোট) 221.83s 204.92s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#32 Claude Sonnet 4.6

medium
অবৈধ SVG
খরচ
$0.000
সময়
300.0s
টোকেন
0 tok

#4 GPT-5.5

low
খরচ
$0.068
সময়
37.0s
টোকেন
2,339 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 6.5 10.0 50.0% 0 2.98s 789 1,046 1,093
GPT-5.5 10.0 10.0 100.0% 0 4.41s 606 238 1,020
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 5.7 6.6 44.4% 1 33.29s 6,995 16,089 3,686
GPT-5.5 10.0 10.0 100.0% 0 15.04s 7,302 423 6,402
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 46.35s 18,351 5,871 3,962
GPT-5.5 10.0 10.0 100.0% 0 9.56s 11,019 303 717
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 13.90s 8,676 649 742
GPT-5.5 10.0 10.0 100.0% 0 3.28s 7,140 228 157
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 2.9 7.2 11.1% 1 0ms 471 25,790 16,919
GPT-5.5 5.3 10.0 33.3% 0 28.05s 723 69 11,609
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.94s 564 256 433
GPT-5.5 10.0 10.0 100.0% 0 5.17s 477 133 245
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 2.61s 792 318 552
GPT-5.5 9.9 10.0 100.0% 0 3.74s 660 93 415
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 5.31s 816 592 646
GPT-5.5 10.0 10.0 100.0% 0 4.74s 642 279 954
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 7.48s 11,454 655 351
GPT-5.5 10.0 10.0 100.0% 0 4.96s 5,445 250 101
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 3.0 10.0 0.0% 0 30.09s 204 3,437 1,586
GPT-5.5 3.0 10.0 0.0% 0 10.06s 195 30 840

দ্রুত তুলনা

তুলনার জুটি বদলান