নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: gpt-oss-120b vs Xiaomi: MiMo-V2.5-Pro

সারাংশ

gpt-oss-120b vs MiMo-V2.5-Pro benchmark তুলনা: gpt-oss-120b average score-এ এগিয়ে: 6.1 vs 5.5. gpt-oss-120b-এর benchmark খরচ কম: $0.013 vs $0.017. MiMo-V2.5-Pro দ্রুত: 1.78s vs 22.28s, pass rates 52.4% vs 39.7%.

প্রস্তাবিত মডেল: MiMo-V2.5-Pro - Its score stays close to the best score here (5.5 vs 6.1), while responding about 12.5x faster than gpt-oss-120b.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-04

মেট্রিক gpt-oss-120b gpt-oss-120b medium প্রকাশ: 2025-08-05 বিনামূল্যে উপলভ্য MiMo-V2.5-Pro MiMo-V2.5-Pro none প্রকাশ: 2026-04-22
স্কোর 6.1 5.5
র‍্যাঙ্ক #99 #123
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.0 8.6
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 52.4% 39.7%
অস্থির টেস্ট 5 4
মোট রান 63 63
প্রতি ফলাফলে খরচ 0.141 0.648
মোট খরচ $0.013 $0.017
ইনপুট মূল্য $0.039 / 1M $0.435 / 1M
আউটপুট মূল্য $0.180 / 1M $0.870 / 1M
মোট ইনপুট টোকেন 39,084 30,724
আউটপুট টোকেন 20,013 3,043
রিজনিং টোকেন 50,233 0
প্রতিক্রিয়া সময় (গড়) 22.28s 1.78s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 68.16s 8.32s
প্রতিক্রিয়া সময় (মোট) 311.96s 37.42s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#99 gpt-oss-120b

medium
Cost
$0.001
Time
26.7s
Tokens
555 tok

#123 MiMo-V2.5-Pro

none
Cost
$0.004
Time
46.4s
Tokens
4,025 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 1,314 3,518 2,177
MiMo-V2.5-Pro 3.3 8.1 8.3% 1 2.67s 645 994 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 5.9 7.0 55.6% 1 38.37s 7,782 3,365 11,973
MiMo-V2.5-Pro 4.3 7.8 22.2% 1 1.41s 6,559 485 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 11,535 694 5,072
MiMo-V2.5-Pro 3.0 10.0 0.0% 0 3.54s 4,695 596 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 7,476 241 1,114
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 1.32s 7,758 249 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 1,266 6,784 20,606
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 877ms 753 27 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 659 107 387
MiMo-V2.5-Pro 4.0 10.0 0.0% 0 2.58s 498 87 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 1,036 126 1,799
MiMo-V2.5-Pro 6.4 10.0 50.0% 0 1.03s 684 66 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 5.3 7.2 44.4% 1 21.71s 1,190 1,790 2,264
MiMo-V2.5-Pro 6.7 4.7 77.8% 2 1.30s 678 267 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 6,514 287 1,083
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 3.30s 8,238 258 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 3.0 10.0 0.0% 0 26.51s 312 3,101 3,758
MiMo-V2.5-Pro 3.0 10.0 0.0% 0 1.89s 216 14 0

দ্রুত তুলনা

তুলনার জুটি বদলান