নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs Anthropic: Claude Opus 4.8

সারাংশ

Claude Opus 4.6 vs Claude Opus 4.8 benchmark তুলনা: average score প্রায় সমান: 7.7 vs 7.7. Claude Opus 4.8-এর benchmark খরচ কম: $1.270 vs $2.053. Claude Opus 4.8 দ্রুত: 10.83s vs 25.89s, pass rates 61.9% vs 79.4%.

প্রস্তাবিত মডেল: Claude Opus 4.8 - It has the best score here (7.7), while costing about 1.6x less than Claude Opus 4.6.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-30

মেট্রিক Claude Opus 4.6 Claude Opus 4.6 medium প্রকাশ: 2026-02-05 Claude Opus 4.8 Claude Opus 4.8 low প্রকাশ: 2026-05-28
স্কোর 7.7 7.7
র‍্যাঙ্ক #40 #38
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.8 8.8
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 61.9% 79.4%
অস্থির টেস্ট 3 3
মোট রান 63 63
প্রতি ফলাফলে খরচ 17.103 8.466
মোট খরচ $2.053 $1.270
ইনপুট মূল্য $5.000 / 1M $5.000 / 1M
আউটপুট মূল্য $25.000 / 1M $25.000 / 1M
মোট ইনপুট টোকেন 53,227 60,946
আউটপুট টোকেন 47,446 31,771
রিজনিং টোকেন 24,000 6,831
প্রতিক্রিয়া সময় (গড়) 25.89s 10.83s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 83.40s 127.97s
প্রতিক্রিয়া সময় (মোট) 362.49s 227.39s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#40 Claude Opus 4.6

medium
অবৈধ SVG
খরচ
$0.000
সময়
300.0s
টোকেন
0 tok

#38 Claude Opus 4.8

low
খরচ
$0.031
সময়
14.1s
টোকেন
1,345 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 840 986 1,071
Claude Opus 4.8 10.0 10.0 100.0% 0 3.30s 834 793 371
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 5.7 7.1 44.4% 1 30.10s 8,522 13,057 4,121
Claude Opus 4.8 6.6 4.6 77.8% 2 7.58s 10,590 3,637 809
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 20,685 8,178 5,194
Claude Opus 4.8 9.8 10.0 100.0% 0 20.84s 23,500 2,216 1,081
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 8,676 691 757
Claude Opus 4.8 6.3 5.8 66.7% 1 2.27s 10,503 310 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 674 14,642 8,687
Claude Opus 4.8 5.3 10.0 33.3% 0 45.53s 975 23,311 3,908
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 564 188 292
Claude Opus 4.8 10.0 10.0 100.0% 0 2.55s 708 231 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 792 266 467
Claude Opus 4.8 9.8 10.0 100.0% 0 2.78s 909 111 221
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 7.7 10.0 66.7% 0 4.71s 816 532 630
Claude Opus 4.8 10.0 10.0 100.0% 0 3.01s 894 592 184
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 11,454 861 329
Claude Opus 4.8 10.0 10.0 100.0% 0 6.85s 11,775 370 35
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 3.0 10.0 0.0% 0 63.24s 204 8,045 2,452
Claude Opus 4.8 3.0 10.0 0.0% 0 5.48s 258 200 222

দ্রুত তুলনা

তুলনার জুটি বদলান