নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs xAI: Grok 4.3

সারাংশ

Claude Sonnet 4.6 vs Grok 4.3 benchmark তুলনা: Grok 4.3 average score-এ এগিয়ে: 7.7 vs 7.3. Claude Sonnet 4.6-এর benchmark খরচ কম: $0.316 vs $0.614. Claude Sonnet 4.6 দ্রুত: 5.04s vs 47.51s, pass rates 55.6% vs 71.4%.

প্রস্তাবিত মডেল: Claude Sonnet 4.6 - Its score stays close to the best score here (7.3 vs 7.7), while costing about 1.9x less than Grok 4.3.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-12

মেট্রিক Claude Sonnet 4.6 Claude Sonnet 4.6 none প্রকাশ: 2026-02-17 Grok 4.3 Grok 4.3 medium প্রকাশ: 2026-05-01
স্কোর 7.3 7.7
র‍্যাঙ্ক #56 #40
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.7 8.5
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 55.6% 71.4%
অস্থির টেস্ট 1 4
মোট রান 63 63
প্রতি ফলাফলে খরচ 2.870 4.724
মোট খরচ $0.316 $0.614
ইনপুট মূল্য $3.000 / 1M $1.250 / 1M
আউটপুট মূল্য $15.000 / 1M $2.500 / 1M
মোট ইনপুট টোকেন 57,886 44,472
আউটপুট টোকেন 9,465 1,981
রিজনিং টোকেন 0 221,382
প্রতিক্রিয়া সময় (গড়) 5.04s 47.51s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 23.84s 216.69s
প্রতিক্রিয়া সময় (মোট) 70.60s 997.68s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#56 Claude Sonnet 4.6

none
Cost
$0.038
Time
27.3s
Tokens
2,598 tok

#40 xAI: Grok 4.3

medium
Cost
$0.009
Time
19.0s
Tokens
3,661 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 636 1,214 0
Grok 4.3 10.0 10.0 100.0% 0 8.83s 2,010 88 8,207
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 5.5 10.0 33.3% 0 5.19s 8,522 2,127 0
Grok 4.3 5.9 7.7 44.4% 1 41.23s 8,340 1,028 31,226
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 26,024 3,766 0
Grok 4.3 10.0 10.0 100.0% 0 63.99s 12,909 234 15,301
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 8,574 252 0
Grok 4.3 10.0 10.0 100.0% 0 18.97s 7,761 180 9,546
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 759 413 0
Grok 4.3 5.3 7.2 44.4% 1 181.74s 1,764 14 111,300
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 513 192 0
Grok 4.3 5.4 2.5 66.7% 1 24.70s 825 70 5,020
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 690 90 0
Grok 4.3 9.8 10.0 100.0% 0 18.58s 1,362 57 8,713
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.53s 663 533 0
Grok 4.3 5.9 7.2 55.6% 1 22.52s 1,689 128 14,468
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 11,301 447 0
Grok 4.3 10.0 10.0 100.0% 0 17.66s 7,263 168 4,615
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 3.0 10.0 0.0% 0 4.67s 204 431 0
Grok 4.3 3.0 10.0 0.0% 0 44.47s 549 14 12,986

দ্রুত তুলনা

তুলনার জুটি বদলান