নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.7 vs Anthropic: Claude Opus 4.8

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-05-28

মেট্রিক Claude Opus 4.7 Claude Opus 4.7 medium প্রকাশ: 2026-04-16 Claude Opus 4.8 Claude Opus 4.8 medium প্রকাশ: 2026-05-28
স্কোর 8.9 8.7
র‍্যাঙ্ক #7 #12
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 10.0 9.6
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 85.0% 83.3%
অস্থির টেস্ট 0 1
মোট রান 60 60
প্রতি ফলাফলে খরচ 3.670 6.285
মোট খরচ $0.624 $1.006
ইনপুট মূল্য $5.000 / 1M $5.000 / 1M
আউটপুট মূল্য $25.000 / 1M $25.000 / 1M
আউটপুট টোকেন 10,439 23,201
রিজনিং টোকেন 2,198 5,901
প্রতিক্রিয়া সময় (গড়) 4.48s 9.34s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 23.18s 38.03s
প্রতিক্রিয়া সময় (মোট) 85.21s 186.84s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.7 8.3 10.0 75.0% 0 1.85s 348 0
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 1,179 478
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.7 10.0 10.0 100.0% 0 14.79s 6,210 1,114
Claude Opus 4.8 10.0 10.0 100.0% 0 14.97s 6,651 1,381
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.7 10.0 10.0 100.0% 0 21.45s 2,369 1,084
Claude Opus 4.8 9.8 10.0 100.0% 0 38.03s 5,260 1,588
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.7 10.0 10.0 100.0% 0 2.37s 324 0
Claude Opus 4.8 7.1 5.6 83.3% 1 12.29s 481 312
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.7 7.7 10.0 66.7% 0 1.17s 51 0
Claude Opus 4.8 5.3 10.0 33.3% 0 14.15s 7,477 900
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.7 10.0 10.0 100.0% 0 2.87s 256 0
Claude Opus 4.8 10.0 10.0 100.0% 0 2.46s 237 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.7 10.0 10.0 100.0% 0 1.57s 114 0
Claude Opus 4.8 10.0 10.0 100.0% 0 3.32s 373 320
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.7 10.0 10.0 100.0% 0 2.43s 370 0
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 791 483
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.7 10.0 10.0 100.0% 0 4.17s 373 0
Claude Opus 4.8 10.0 10.0 100.0% 0 8.96s 301 225
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.7 3.0 10.0 0.0% 0 2.25s 24 0
Claude Opus 4.8 3.0 10.0 0.0% 0 6.14s 451 214

দ্রুত তুলনা

তুলনার জুটি বদলান