নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Sonnet 5 vs OpenAI: GPT-5.5

সারাংশ

Claude Sonnet 5 vs GPT-5.5 benchmark তুলনা: GPT-5.5 average score-এ এগিয়ে: 9.3 vs 7.9. Claude Sonnet 5-এর benchmark খরচ কম: $0.550 vs $0.907. GPT-5.5 দ্রুত: 9.76s vs 9.94s, pass rates 79.4% vs 85.7%.

প্রস্তাবিত মডেল: GPT-5.5 - It has the strongest score in this comparison (9.3) and the best overall balance of cost and response time across all 2 models.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-30

মেট্রিক Claude Sonnet 5 Claude Sonnet 5 medium প্রকাশ: 2026-06-30 GPT-5.5 GPT-5.5 low প্রকাশ: 2026-04-24
স্কোর 7.9 9.3
র‍্যাঙ্ক #30 #4
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.0 10.0
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 79.4% 85.7%
অস্থির টেস্ট 3 0
মোট রান 63 63
প্রতি ফলাফলে খরচ 3.662 5.035
মোট খরচ $0.550 $0.907
ইনপুট মূল্য $2.000 / 1M $5.000 / 1M
আউটপুট মূল্য $10.000 / 1M $30.000 / 1M
মোট ইনপুট টোকেন 67,416 34,209
আউটপুট টোকেন 34,012 2,046
রিজনিং টোকেন 7,673 22,460
প্রতিক্রিয়া সময় (গড়) 9.94s 9.76s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 56.94s 56.19s
প্রতিক্রিয়া সময় (মোট) 208.71s 204.92s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#30 Claude Sonnet 5

medium
খরচ
$0.007
সময়
6.4s
টোকেন
832 tok

#4 GPT-5.5

low
খরচ
$0.068
সময়
37.0s
টোকেন
2,339 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 5 10.0 10.0 100.0% 0 3.80s 834 1,220 446
GPT-5.5 10.0 10.0 100.0% 0 4.41s 606 238 1,020
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 5 9.0 7.9 88.9% 1 17.28s 10,590 13,153 2,379
GPT-5.5 10.0 10.0 100.0% 0 15.04s 7,302 423 6,402
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 5 4.5 2.1 66.7% 1 37.01s 29,394 4,848 2,170
GPT-5.5 10.0 10.0 100.0% 0 9.56s 11,019 303 717
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 5 10.0 10.0 100.0% 0 3.16s 10,503 312 0
GPT-5.5 10.0 10.0 100.0% 0 3.28s 7,140 228 157
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 5 7.7 10.0 66.7% 0 20.38s 975 12,140 1,994
GPT-5.5 5.3 10.0 33.3% 0 28.05s 723 69 11,609
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 5 4.8 3.2 33.3% 1 4.32s 708 264 0
GPT-5.5 10.0 10.0 100.0% 0 5.17s 477 133 245
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 5 9.9 10.0 100.0% 0 3.10s 909 318 269
GPT-5.5 9.9 10.0 100.0% 0 3.74s 660 93 415
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 5 7.7 10.0 66.7% 0 2.98s 894 407 121
GPT-5.5 10.0 10.0 100.0% 0 4.74s 642 279 954
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 5 10.0 10.0 100.0% 0 10.70s 12,351 433 90
GPT-5.5 10.0 10.0 100.0% 0 4.96s 5,445 250 101
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 5 3.0 10.0 0.0% 0 7.06s 258 917 204
GPT-5.5 3.0 10.0 0.0% 0 10.06s 195 30 840

দ্রুত তুলনা

তুলনার জুটি বদলান