নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs xAI: Grok 4.20

সারাংশ

Claude Sonnet 4.6 vs Grok 4.20 benchmark তুলনা: average score প্রায় সমান: 7.3 vs 7.3. Claude Sonnet 4.6-এর benchmark খরচ কম: $0.316 vs $0.609. Claude Sonnet 4.6 দ্রুত: 5.04s vs 27.68s, pass rates 55.6% vs 63.5%.

প্রস্তাবিত মডেল: Claude Sonnet 4.6 - It has the best score here (7.3), while costing about 1.9x less than Grok 4.20.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-07-02

মেট্রিক Claude Sonnet 4.6 Claude Sonnet 4.6 none প্রকাশ: 2026-02-17 Grok 4.20 Grok 4.20 medium প্রকাশ: 2026-03-31
স্কোর 7.3 7.3
র‍্যাঙ্ক #57 #55
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.7 8.8
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 55.6% 63.5%
অস্থির টেস্ট 1 3
মোট রান 63 63
প্রতি ফলাফলে খরচ 2.870 8.309
মোট খরচ $0.316 $0.609
ইনপুট মূল্য $3.000 / 1M $1.250 / 1M
আউটপুট মূল্য $15.000 / 1M $2.500 / 1M
মোট ইনপুট টোকেন 57,886 44,433
আউটপুট টোকেন 9,465 1,819
রিজনিং টোকেন 0 219,524
প্রতিক্রিয়া সময় (গড়) 5.04s 27.68s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 23.84s 199.66s
প্রতিক্রিয়া সময় (মোট) 70.60s 581.26s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#57 Claude Sonnet 4.6

none
খরচ
$0.038
সময়
27.3s
টোকেন
2,598 tok

#55 xAI: Grok 4.20

medium
খরচ
$0.041
সময়
110.3s
টোকেন
16,336 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 636 1,214 0
Grok 4.20 8.2 7.9 83.3% 1 3.95s 2,010 287 8,312
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 5.5 10.0 33.3% 0 5.19s 8,522 2,127 0
Grok 4.20 6.3 6.6 55.6% 1 109.93s 8,307 268 103,150
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 26,024 3,766 0
Grok 4.20 10.0 10.0 100.0% 0 17.40s 12,909 232 9,556
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 8,574 252 0
Grok 4.20 10.0 10.0 100.0% 0 4.17s 7,761 180 5,333
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 759 413 0
Grok 4.20 5.3 10.0 33.3% 0 27.03s 1,764 375 49,339
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 513 192 0
Grok 4.20 3.9 2.6 33.3% 1 24.48s 825 65 6,440
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 690 90 0
Grok 4.20 9.8 10.0 100.0% 0 4.26s 1,362 57 6,419
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.53s 663 533 0
Grok 4.20 7.7 10.0 66.7% 0 6.22s 1,689 149 7,913
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 11,301 447 0
Grok 4.20 3.0 10.0 0.0% 0 13.68s 7,275 197 6,620
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 3.0 10.0 0.0% 0 4.67s 204 431 0
Grok 4.20 3.0 10.0 0.0% 0 63.48s 531 9 16,442

দ্রুত তুলনা

তুলনার জুটি বদলান