নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs Z.ai: GLM 5.2

সারাংশ

Claude Opus 4.8 vs GLM 5.2 benchmark তুলনা: Claude Opus 4.8 average score-এ এগিয়ে: 7.2 vs 7.1. GLM 5.2-এর benchmark খরচ কম: $0.076 vs $0.539. Claude Opus 4.8 দ্রুত: 3.47s vs 6.34s, pass rates 61.9% vs 60.3%.

প্রস্তাবিত মডেল: GLM 5.2 - Its score stays close to the best score here (7.1 vs 7.2), while costing about 7.1x less than Claude Opus 4.8.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-17

মেট্রিক Claude Opus 4.8 Claude Opus 4.8 none প্রকাশ: 2026-05-28 GLM 5.2 GLM 5.2 none প্রকাশ: 2026-06-17
স্কোর 7.2 7.1
র‍্যাঙ্ক #57 #61
নির্ভরযোগ্যতা 10.0 9.9
ধারাবাহিকতা 9.2 9.6
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 61.9% 60.3%
অস্থির টেস্ট 2 1
মোট রান 63 63
প্রতি ফলাফলে খরচ 4.485 0.628
মোট খরচ $0.539 $0.076
ইনপুট মূল্য $5.000 / 1M $1.400 / 1M
আউটপুট মূল্য $25.000 / 1M $4.400 / 1M
মোট ইনপুট টোকেন 67,104 38,671
আউটপুট টোকেন 8,107 4,817
রিজনিং টোকেন 0 0
প্রতিক্রিয়া সময় (গড়) 3.47s 6.34s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 17.73s 20.69s
প্রতিক্রিয়া সময় (মোট) 72.90s 133.19s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#57 Claude Opus 4.8

none
Cost
$0.053
Time
22.0s
Tokens
2,253 tok

#61 GLM 5.2

none
Invalid SVG
Cost
$0.033
Time
87.7s
Tokens
7,455 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 6.5 10.0 50.0% 0 3.40s 834 1,472 0
GLM 5.2 8.3 10.0 75.0% 0 3.70s 567 313 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 5.5 10.0 33.3% 0 3.29s 10,590 1,332 0
GLM 5.2 3.7 9.5 0.0% 0 7.55s 7,263 1,958 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 9.5 10.0 100.0% 0 17.73s 29,658 3,259 0
GLM 5.2 10.0 10.0 100.0% 0 20.69s 14,296 1,489 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 7.3 5.8 83.3% 1 1.77s 10,503 308 0
GLM 5.2 10.0 10.0 100.0% 0 7.17s 7,113 204 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 5.3 7.2 44.4% 1 1.66s 975 61 0
GLM 5.2 5.3 10.0 33.3% 0 6.50s 696 27 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 10.0 10.0 100.0% 0 3.48s 708 230 0
GLM 5.2 6.1 3.1 66.7% 1 4.42s 480 82 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 9.9 10.0 100.0% 0 1.37s 909 95 0
GLM 5.2 9.8 10.0 100.0% 0 3.84s 642 66 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 7.7 10.0 66.7% 0 2.74s 894 783 0
GLM 5.2 7.7 10.0 66.7% 0 3.31s 618 265 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 10.0 10.0 100.0% 0 5.35s 11,775 355 0
GLM 5.2 10.0 10.0 100.0% 0 15.76s 6,807 400 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 3.0 10.0 0.0% 0 3.41s 258 212 0
GLM 5.2 3.0 10.0 0.0% 0 3.41s 189 13 0

দ্রুত তুলনা

তুলনার জুটি বদলান