নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs OpenAI: GPT-5.2

সারাংশ

Claude Sonnet 4.6 vs GPT-5.2 benchmark তুলনা: GPT-5.2 average score-এ এগিয়ে: 8.4 vs 7.3. Claude Sonnet 4.6-এর benchmark খরচ কম: $0.316 vs $0.548. Claude Sonnet 4.6 দ্রুত: 5.04s vs 16.88s, pass rates 55.6% vs 71.4%.

প্রস্তাবিত মডেল: GPT-5.2 - It has the strongest score in this comparison (8.4) and the best overall balance of cost and response time across all 2 models.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-07-02

মেট্রিক Claude Sonnet 4.6 Claude Sonnet 4.6 none প্রকাশ: 2026-02-17 GPT-5.2 GPT-5.2 medium প্রকাশ: 2025-12-11
স্কোর 7.3 8.4
র‍্যাঙ্ক #57 #22
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.7 8.4
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 55.6% 71.4%
অস্থির টেস্ট 1 4
মোট রান 63 63
প্রতি ফলাফলে খরচ 2.870 4.209
মোট খরচ $0.316 $0.548
ইনপুট মূল্য $3.000 / 1M $1.750 / 1M
আউটপুট মূল্য $15.000 / 1M $14.000 / 1M
মোট ইনপুট টোকেন 57,886 33,967
আউটপুট টোকেন 9,465 2,901
রিজনিং টোকেন 0 31,932
প্রতিক্রিয়া সময় (গড়) 5.04s 16.88s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 23.84s 77.80s
প্রতিক্রিয়া সময় (মোট) 70.60s 236.34s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#57 Claude Sonnet 4.6

none
খরচ
$0.038
সময়
27.3s
টোকেন
2,598 tok

#22 GPT-5.2

medium
খরচ
$0.047
সময়
49.2s
টোকেন
3,396 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 636 1,214 0
GPT-5.2 6.5 8.0 58.3% 1 7.81s 606 567 2,002
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 5.5 10.0 33.3% 0 5.19s 8,522 2,127 0
GPT-5.2 10.0 10.0 100.0% 0 22.73s 7,302 511 11,912
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 26,024 3,766 0
GPT-5.2 10.0 10.0 100.0% 0 14.06s 11,019 291 1,757
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 8,574 252 0
GPT-5.2 10.0 10.0 100.0% 0 3.15s 7,140 234 420
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 759 413 0
GPT-5.2 5.9 7.2 55.6% 1 77.80s 473 42 10,342
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 513 192 0
GPT-5.2 3.7 9.7 0.0% 0 4.32s 477 162 269
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 690 90 0
GPT-5.2 9.9 10.0 100.0% 0 3.12s 660 94 614
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.53s 663 533 0
GPT-5.2 7.5 7.3 77.8% 1 5.80s 642 735 924
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 11,301 447 0
GPT-5.2 4.7 1.6 66.7% 1 10.30s 5,453 239 469
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 3.0 10.0 0.0% 0 4.67s 204 431 0
GPT-5.2 3.0 10.0 0.0% 0 28.18s 195 26 3,223

দ্রুত তুলনা

তুলনার জুটি বদলান