নেভিগেশন
AI BENCHY
তুলনা করুন চার্ট Poddhoti
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs OpenAI: GPT-5.4

তুলনা করুন:

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-06

মেট্রিক Anthropic: Claude Sonnet 4.6 none প্রকাশ: 2026-02-17 OpenAI: GPT-5.4 medium প্রকাশ: 2026-03-05
র‍্যাঙ্ক #25 #9
গড় স্কোর 6.8 8.0
ধারাবাহিকতা 9.6 8.5
প্রতি ফলাফলে খরচ 2.504 6.601
মোট খরচ $0.251 $0.793
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 66.7% 83.3%
অস্থির টেস্ট 1 3
মোট রান 48 (16 x 3) 48 (16 x 3)
আউটপুট টোকেন 6,895 1,756
রিজনিং টোকেন 0 46,642
প্রতিক্রিয়া সময় (গড়) 5.57s 20.05s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 23.84s 100.41s
প্রতিক্রিয়া সময় (মোট) 50.12s 320.87s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

গড় স্কোর vs প্রতিক্রিয়া সময় (গড়)

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Anthropic: Claude Sonnet 4.6 4.0 10.0 33.3% 0 4.83s 1,199 0
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 5.02s 216 1,466
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Anthropic: Claude Sonnet 4.6 9.0 10.0 100.0% 0 23.84s 3,766 0
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Anthropic: Claude Sonnet 4.6 9.9 10.0 100.0% 0 3.43s 252 0
OpenAI: GPT-5.4 9.9 10.0 100.0% 0 5.32s 234 804
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Anthropic: Claude Sonnet 4.6 7.0 10.0 66.7% 0 3.54s 413 0
OpenAI: GPT-5.4 4.0 7.2 44.4% 1 74.27s 61 34,748
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Anthropic: Claude Sonnet 4.6 5.0 3.1 66.7% 1 2.56s 192 0
OpenAI: GPT-5.4 5.0 3.1 33.3% 1 4.92s 145 321
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Anthropic: Claude Sonnet 4.6 5.5 10.0 50.0% 0 1.96s 90 0
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Anthropic: Claude Sonnet 4.6 7.0 10.0 66.7% 0 2.92s 536 0
OpenAI: GPT-5.4 7.0 7.2 88.9% 1 9.13s 442 3,832
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Anthropic: Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 447 0
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031

দ্রুত তুলনা

তুলনার জুটি বদলান