নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs OpenAI: GPT-5.2 Chat

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-01

মেট্রিক Claude Sonnet 4.6 Claude Sonnet 4.6 medium প্রকাশ: 2026-02-17 GPT-5.2 Chat GPT-5.2 Chat none প্রকাশ: 2025-12-11
স্কোর 7.6 7.9
র‍্যাঙ্ক #52 #32
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.2 8.9
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 68.3% 73.3%
অস্থির টেস্ট 2 3
মোট রান 60 60
প্রতি ফলাফলে খরচ 10.229 2.703
মোট খরচ $1.330 $0.352
ইনপুট মূল্য $3.000 / 1M $1.750 / 1M
আউটপুট মূল্য $15.000 / 1M $14.000 / 1M
আউটপুট টোকেন 49,891 21,144
রিজনিং টোকেন 29,565 0
প্রতিক্রিয়া সময় (গড়) 15.81s 6.82s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 46.35s 38.52s
প্রতিক্রিয়া সময় (মোট) 189.71s 136.34s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 6.5 10.0 50.0% 0 2.98s 1,046 1,093
GPT-5.2 Chat 8.7 7.9 91.7% 1 3.40s 1,807 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 6.9 6.0 66.7% 1 33.87s 11,277 3,281
GPT-5.2 Chat 8.2 6.7 83.3% 1 8.05s 4,131 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 46.35s 5,871 3,962
GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 1,243 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 13.90s 649 742
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.05s 980 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 2.9 7.2 11.1% 1 0ms 25,790 16,919
GPT-5.2 Chat 5.3 10.0 33.3% 0 17.78s 7,810 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.94s 256 433
GPT-5.2 Chat 4.4 3.0 33.3% 1 3.20s 335 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 2.61s 318 552
GPT-5.2 Chat 9.8 10.0 100.0% 0 5.51s 1,441 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 5.31s 592 646
GPT-5.2 Chat 7.7 10.0 66.7% 0 4.10s 1,603 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 7.48s 655 351
GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 555 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 3.0 10.0 0.0% 0 30.09s 3,437 1,586
GPT-5.2 Chat 3.0 10.0 0.0% 0 6.89s 1,239 0

দ্রুত তুলনা

তুলনার জুটি বদলান