নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs Xiaomi: MiMo-V2.5-Pro

সারাংশ

Claude Sonnet 4.6 vs MiMo-V2.5-Pro benchmark তুলনা: MiMo-V2.5-Pro average score-এ এগিয়ে: 7.4 vs 7.3. MiMo-V2.5-Pro-এর benchmark খরচ কম: $0.106 vs $0.316. Claude Sonnet 4.6 দ্রুত: 5.04s vs 26.13s, pass rates 55.6% vs 68.3%.

প্রস্তাবিত মডেল: MiMo-V2.5-Pro - It has the best score here (7.4), while costing about 3.0x less than Claude Sonnet 4.6.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-12

মেট্রিক Claude Sonnet 4.6 Claude Sonnet 4.6 none প্রকাশ: 2026-02-17 MiMo-V2.5-Pro MiMo-V2.5-Pro medium প্রকাশ: 2026-04-22
স্কোর 7.3 7.4
র‍্যাঙ্ক #56 #52
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.7 8.5
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 55.6% 68.3%
অস্থির টেস্ট 1 4
মোট রান 63 63
প্রতি ফলাফলে খরচ 2.870 2.541
মোট খরচ $0.316 $0.106
ইনপুট মূল্য $3.000 / 1M $0.435 / 1M
আউটপুট মূল্য $15.000 / 1M $0.870 / 1M
মোট ইনপুট টোকেন 57,886 40,854
আউটপুট টোকেন 9,465 5,015
রিজনিং টোকেন 0 97,742
প্রতিক্রিয়া সময় (গড়) 5.04s 26.13s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 23.84s 130.77s
প্রতিক্রিয়া সময় (মোট) 70.60s 548.65s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#56 Claude Sonnet 4.6

none
Cost
$0.038
Time
27.3s
Tokens
2,598 tok

#52 MiMo-V2.5-Pro

medium
Invalid SVG
Cost
$0.000
Time
300.0s
Tokens
0 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 636 1,214 0
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 3.26s 621 323 1,179
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 5.5 10.0 33.3% 0 5.19s 8,522 2,127 0
MiMo-V2.5-Pro 6.2 4.7 66.7% 2 92.07s 6,543 780 51,218
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 26,024 3,766 0
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 53.36s 15,060 348 11,870
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 8,574 252 0
MiMo-V2.5-Pro 7.3 5.8 83.3% 1 18.81s 7,746 260 8,383
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 759 413 0
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 37.87s 630 275 17,023
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 513 192 0
MiMo-V2.5-Pro 5.5 10.0 0.0% 0 4.02s 492 155 163
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 690 90 0
MiMo-V2.5-Pro 9.9 10.0 100.0% 0 2.77s 672 82 803
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.53s 663 533 0
MiMo-V2.5-Pro 6.7 7.9 55.6% 1 5.31s 660 540 2,181
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 11,301 447 0
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 16.87s 8,220 311 2,908
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 3.0 10.0 0.0% 0 4.67s 204 431 0
MiMo-V2.5-Pro 3.0 10.0 0.0% 0 12.46s 210 1,941 2,014

দ্রুত তুলনা

তুলনার জুটি বদলান