নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs MiniMax: MiniMax M3

সারাংশ

Claude Opus 4.6 vs MiniMax M3 benchmark তুলনা: Claude Opus 4.6 average score-এ এগিয়ে: 7.7 vs 7.6. MiniMax M3-এর benchmark খরচ কম: $0.131 vs $2.053. Claude Opus 4.6 দ্রুত: 25.89s vs 68.17s, pass rates 61.9% vs 65.1%.

প্রস্তাবিত মডেল: MiniMax M3 - Its score stays close to the best score here (7.6 vs 7.7), while costing about 15.7x less than Claude Opus 4.6.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-07-02

মেট্রিক Claude Opus 4.6 Claude Opus 4.6 medium প্রকাশ: 2026-02-05 MiniMax M3 MiniMax M3 medium প্রকাশ: 2026-06-01
স্কোর 7.7 7.6
র‍্যাঙ্ক #40 #42
নির্ভরযোগ্যতা 10.0 9.6
ধারাবাহিকতা 8.8 7.9
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 61.9% 65.1%
অস্থির টেস্ট 3 5
মোট রান 63 63
প্রতি ফলাফলে খরচ 17.103 1.187
মোট খরচ $2.053 $0.131
ইনপুট মূল্য $5.000 / 1M $0.300 / 1M
আউটপুট মূল্য $25.000 / 1M $1.200 / 1M
মোট ইনপুট টোকেন 53,227 46,546
আউটপুট টোকেন 47,446 49,036
রিজনিং টোকেন 24,000 92,543
প্রতিক্রিয়া সময় (গড়) 25.89s 68.17s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 83.40s 431.03s
প্রতিক্রিয়া সময় (মোট) 362.49s 1363.38s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#40 Claude Opus 4.6

medium
অবৈধ SVG
খরচ
$0.000
সময়
300.0s
টোকেন
0 tok

#42 MiniMax M3

medium
খরচ
$0.012
সময়
154.4s
টোকেন
10,018 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 840 986 1,071
MiniMax M3 5.5 3.7 66.7% 3 14.95s 2,526 874 3,414
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 5.7 7.1 44.4% 1 30.10s 8,522 13,057 4,121
MiniMax M3 6.1 6.5 55.6% 1 144.74s 5,804 6,223 32,667
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 20,685 8,178 5,194
MiniMax M3 10.0 10.0 100.0% 0 65.30s 14,760 1,306 6,253
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 8,676 691 757
MiniMax M3 10.0 10.0 100.0% 0 14.92s 8,088 514 3,164
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 674 14,642 8,687
MiniMax M3 5.5 9.3 33.3% 0 233.13s 869 16,254 19,070
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 564 188 292
MiniMax M3 5.1 3.4 33.3% 1 33.25s 954 2,487 2,523
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 792 266 467
MiniMax M3 9.8 10.0 100.0% 0 6.14s 1,623 103 920
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 7.7 10.0 66.7% 0 4.71s 816 532 630
MiniMax M3 7.9 9.9 66.7% 0 49.91s 2,079 11,946 13,761
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 11,454 861 329
MiniMax M3 10.0 10.0 100.0% 0 11.91s 9,168 281 555
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 3.0 10.0 0.0% 0 63.24s 204 8,045 2,452
MiniMax M3 3.0 10.0 0.0% 0 100.80s 675 9,048 10,216

দ্রুত তুলনা

তুলনার জুটি বদলান