নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs Xiaomi: MiMo-V2-Flash

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-05-29

মেট্রিক Claude Opus 4.8 Claude Opus 4.8 none প্রকাশ: 2026-05-28 MiMo-V2-Flash MiMo-V2-Flash medium প্রকাশ: 2025-12-16
স্কোর 7.3 7.1
র‍্যাঙ্ক #65 #77
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.2 8.7
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 65.0% 63.3%
অস্থির টেস্ট 2 3
মোট রান 60 60
প্রতি ফলাফলে খরচ 4.324 0.345
মোট খরচ $0.519 $0.038
ইনপুট মূল্য $5.000 / 1M $0.100 / 1M
আউটপুট মূল্য $25.000 / 1M $0.300 / 1M
আউটপুট টোকেন 8,098 12,458
রিজনিং টোকেন 0 115,182
প্রতিক্রিয়া সময় (গড়) 3.51s 20.28s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 17.73s 96.01s
প্রতিক্রিয়া সময় (মোট) 70.19s 283.87s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 6.5 10.0 50.0% 0 3.40s 1,472 0
MiMo-V2-Flash 8.1 7.9 83.3% 1 15.85s 1,674 23,559
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 6.8 10.0 50.0% 0 3.59s 1,323 0
MiMo-V2-Flash 4.1 5.8 33.3% 1 7.20s 456 3,648
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 9.5 10.0 100.0% 0 17.73s 3,259 0
MiMo-V2-Flash 9.8 10.0 100.0% 0 75.68s 442 26,859
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 7.3 5.8 83.3% 1 1.77s 308 0
MiMo-V2-Flash 6.5 10.0 50.0% 0 0ms 153 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 5.3 7.2 44.4% 1 1.66s 61 0
MiMo-V2-Flash 5.9 7.2 55.6% 1 96.01s 8,374 42,461
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 10.0 10.0 100.0% 0 3.48s 230 0
MiMo-V2-Flash 4.0 10.0 0.0% 0 4.20s 87 488
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 9.9 10.0 100.0% 0 1.37s 95 0
MiMo-V2-Flash 10.0 10.0 100.0% 0 4.28s 75 3,504
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 7.7 10.0 66.7% 0 2.74s 783 0
MiMo-V2-Flash 7.7 10.0 66.7% 0 3.87s 864 1,948
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 10.0 10.0 100.0% 0 5.35s 355 0
MiMo-V2-Flash 10.0 10.0 100.0% 0 27.78s 321 12,715
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 3.0 10.0 0.0% 0 3.41s 212 0
MiMo-V2-Flash 3.0 10.0 0.0% 0 1.96s 12 0

দ্রুত তুলনা

তুলনার জুটি বদলান