নেভিগেশন
AI BENCHY
তুলনা করুন চার্ট Poddhoti
❤️ Made by XCS
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.3 Chat vs Xiaomi: MiMo-V2-Flash

তুলনা করুন:

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-06

মেট্রিক OpenAI: GPT-5.3 Chat none প্রকাশ: 2026-03-03 Xiaomi: MiMo-V2-Flash medium প্রকাশ: 2025-12-16
গড় স্কোর 7.3 7.2
র‍্যাঙ্ক #19 #21
সঠিক টেস্ট
ধারাবাহিকতা 8.5 9.5
প্রতি ফলাফলে খরচ 3.163 0.316
মোট খরচ $0.317 $0.035
প্রতি চেষ্টায় পাস রেট 70.8% 72.9%
অস্থির টেস্ট 3 1
common.totalRuns 48 (16 x 3) 48 (16 x 3)
আউটপুট টোকেন 19,272 11,613
রিজনিং টোকেন 0 106,714
প্রতিক্রিয়া সময় (গড়) 5.96s 25.33s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 18.33s 96.01s
প্রতিক্রিয়া সময় (মোট) 95.30s 253.33s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

গড় স্কোর vs প্রতিক্রিয়া সময় (গড়)

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.3 Chat 7.3 7.5 77.8% 1 4.72s 3,091 0
Xiaomi: MiMo-V2-Flash 9.7 10.0 100.0% 0 16.79s 1,328 18,739
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 2,614 0
Xiaomi: MiMo-V2-Flash 9.0 10.0 100.0% 0 75.68s 442 26,859
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.3 Chat 9.9 10.0 100.0% 0 2.21s 942 0
Xiaomi: MiMo-V2-Flash 5.5 10.0 50.0% 0 0ms 153 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.3 Chat 10.0 4.4 33.3% 2 13.01s 8,264 0
Xiaomi: MiMo-V2-Flash 4.0 7.2 55.6% 1 96.01s 8,374 42,461
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.3 Chat 4.0 10.0 0.0% 0 1.99s 319 0
Xiaomi: MiMo-V2-Flash 3.0 10.0 0.0% 0 4.20s 87 488
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.3 Chat 9.0 10.0 50.0% 0 3.29s 1,455 0
Xiaomi: MiMo-V2-Flash 10.0 10.0 100.0% 0 4.28s 75 3,504
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.3 Chat 10.0 10.0 100.0% 0 2.93s 1,726 0
Xiaomi: MiMo-V2-Flash 7.0 10.0 66.7% 0 3.77s 833 1,948
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 861 0
Xiaomi: MiMo-V2-Flash 10.0 10.0 100.0% 0 27.78s 321 12,715

দ্রুত তুলনা

তুলনার জুটি বদলান