নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Mistral: Mistral Small 4 vs OpenAI: gpt-oss-120b

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-05-01

মেট্রিক Mistral Small 4 Mistral Small 4 medium প্রকাশ: 2026-03-16 gpt-oss-120b gpt-oss-120b medium প্রকাশ: 2025-08-05 বিনামূল্যে উপলভ্য
স্কোর 5.7 5.8
র‍্যাঙ্ক #99 #91
নির্ভরযোগ্যতা প্রযোজ্য নয় প্রযোজ্য নয়
ধারাবাহিকতা 6.8 7.2
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 50.0% 51.9%
অস্থির টেস্ট 7 6
মোট রান 54 54
প্রতি ফলাফলে খরচ 0.674 0.144
মোট খরচ $0.034 $0.011
???? ??? $0.150 / 1M $0.000 / 1M
????? ??? $0.600 / 1M $0.000 / 1M
আউটপুট টোকেন 15,084 13,493
রিজনিং টোকেন 39,408 36,879
প্রতিক্রিয়া সময় (গড়) 5.64s 16.08s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 30.49s 50.92s
প্রতিক্রিয়া সময় (মোট) 101.52s 176.88s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mistral Small 4 5.6 3.8 66.7% 3 2.67s 4,055 4,778
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 3,518 2,177
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mistral Small 4 6.7 3.5 66.7% 1 30.49s 2,796 11,296
gpt-oss-120b 4.3 1.1 66.7% 1 26.33s 228 2,549
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mistral Small 4 3.0 10.0 0.0% 0 25.25s 2,612 10,700
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 694 5,072
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mistral Small 4 7.3 5.9 83.3% 1 1.23s 335 723
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 241 1,114
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mistral Small 4 5.3 7.2 44.4% 1 6.11s 2,621 6,904
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 6,784 20,606
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mistral Small 4 4.8 10.0 0.0% 0 2.05s 821 828
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 107 387
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mistral Small 4 7.3 5.8 83.3% 1 1.38s 540 1,031
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 126 1,799
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mistral Small 4 3.4 9.7 0.0% 0 2.00s 983 2,338
gpt-oss-120b 3.2 4.7 22.2% 2 11.80s 1,508 2,092
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mistral Small 4 10.0 10.0 100.0% 0 3.50s 321 810
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 287 1,083

দ্রুত তুলনা

তুলনার জুটি বদলান