#38

Claude Opus 4.8

Anthropic প্রকাশ: 2026-05-28 পরীক্ষিত হয়েছে: 2026-06-30 22:08 anthropic/claude-opus-4.8::low

(medium) (low) (none)

সারাংশ

Claude Opus 4.8 AI BENCHY-তে 7.7 স্কোর করে এবং #38 স্থানে আছে। এর reliability 10.0, pass rate 79.4%, মোট খরচ $1.270, এবং গড় response time 10.83s.

Claude Opus 4.8 কে আলাদা করে যা: এটি ধাঁধা সমাধান-তে সবচেয়ে ভালোভাবে নজর কাড়ে, যেখানে এর rank #1; আর ডেটা পার্সিং ও নিষ্কাশন এর দুর্বলতম ক্ষেত্র, rank #17.

স্কোর

7.7

ধারাবাহিকতা

8.8

নির্ভরযোগ্যতা

10.0

মোট খরচ (বর্তমান মূল্য)

$1.270

মোট আউটপুট টোকেন

38,602

মোট ইনপুট টোকেন

60,946

ইনপুট মূল্য

$5.000 / 1M

আউটপুট মূল্য

$25.000 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 6

প্রতি চেষ্টায় পাস রেট: 79.4%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

10.83s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 127.97s

প্রতিক্রিয়া সময় (মোট): 227.39s

ভুল উত্তর: 4 অতিরিক্ত ফরম্যাটিং: 1 কোন উত্তর নেই: 1

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#38 Claude Opus 4.8

low

খরচ: $0.031
সময়: 14.1s
টোকেন: 1,345 tok

মূল্যের ইতিহাস

OpenRouter থেকে এই মডেলের ঐতিহাসিক মূল্য তথ্য।

তারিখ	ইনপুট মূল্য	আউটপুট মূল্য
2026-06-30 22:09	$5.000 / 1M	$25.000 / 1M

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

Claude Opus 4.8lowvsKimi K2.6mediumবিনামূল্যে উপলভ্য Claude Opus 4.8lowvsGemini 3.1 Flash Litemedium Claude Opus 4.8lowvsGrok 4.3medium Claude Opus 4.8lowvsQwen3.5 Plus 2026-04-20medium Claude Opus 4.8lowvsClaude Opus 4.6medium Claude Opus 4.8lowvsGemini 3.5 Flashhigh Claude Opus 4.8lowvsGemini 3 Flash Previewmedium Claude Opus 4.8lowvsNemotron 3 Ultra 550b A55bmediumবিনামূল্যে উপলভ্য Claude Opus 4.8lowvsGPT-5.5low

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	10.0	10.0
কোডিং	6.6	4.6
সমন্বিত	9.8	10.0
ডেটা পার্সিং ও নিষ্কাশন	6.3	5.8
ডোমেইন-নির্দিষ্ট	5.3	10.0
Sadharon Buddhimotta	10.0	10.0
নির্দেশনা অনুসরণ	9.8	10.0
ধাঁধা সমাধান	10.0	10.0
টুল কলিং	10.0	10.0
সাধারণ জ্ঞান	3.0	10.0

Claude Opus 4.8

Hamster playing table tennis

#38 Claude Opus 4.8

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল