নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

Mistral: Mistral Small 4 vs xAI: Grok 4.20

সারাংশ

Mistral Small 4 vs Grok 4.20 benchmark তুলনা: Mistral Small 4 average score-এ এগিয়ে: 5.1 vs 4.4. Mistral Small 4-এর benchmark খরচ কম: $0.007 vs $0.057. Mistral Small 4 দ্রুত: 630ms vs 1.11s, pass rates 27.0% vs 28.6%.

প্রস্তাবিত মডেল: Mistral Small 4 - It has the best score here (5.1), while costing about 8.2x less than Grok 4.20.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-07-02

মেট্রিক Mistral Small 4 Mistral Small 4 none প্রকাশ: 2026-03-16 Grok 4.20 Grok 4.20 none প্রকাশ: 2026-03-31
স্কোর 5.1 4.4
র‍্যাঙ্ক #134 #160
নির্ভরযোগ্যতা 10.0 প্রযোজ্য নয়
ধারাবাহিকতা 9.5 8.5
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 27.0% 28.6%
অস্থির টেস্ট 1 0
মোট রান 63 54
প্রতি ফলাফলে খরচ 0.139 1.570
মোট খরচ $0.007 $0.057
ইনপুট মূল্য $0.150 / 1M $1.250 / 1M
আউটপুট মূল্য $0.600 / 1M $2.500 / 1M
মোট ইনপুট টোকেন 37,309 41,313
আউটপুট টোকেন 2,201 1,923
রিজনিং টোকেন 0 0
প্রতিক্রিয়া সময় (গড়) 630ms 1.11s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 1.72s 6.04s
প্রতিক্রিয়া সময় (মোট) 13.22s 19.96s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#134 Mistral Small 4

none
খরচ
$0.002
সময়
10.4s
টোকেন
2,370 tok

#160 xAI: Grok 4.20

none
খরচ
$0.004
সময়
6.5s
টোকেন
1,367 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mistral Small 4 3.4 7.9 16.7% 1 395ms 708 182 0
Grok 4.20 4.8 10.0 25.0% 0 501ms 1,986 267 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mistral Small 4 3.7 9.7 0.0% 0 901ms 7,636 619 0
Grok 4.20 1.1 3.1 0.0% 0 1.22s 1,074 312 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mistral Small 4 3.0 10.0 0.0% 0 1.72s 11,640 496 0
Grok 4.20 3.0 10.0 0.0% 0 6.04s 17,673 282 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mistral Small 4 10.0 10.0 100.0% 0 822ms 7,914 261 0
Grok 4.20 10.0 10.0 100.0% 0 522ms 7,749 207 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mistral Small 4 5.3 10.0 33.3% 0 367ms 798 28 0
Grok 4.20 3.0 10.0 0.0% 0 687ms 1,746 325 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mistral Small 4 4.0 10.0 0.0% 0 729ms 519 205 0
Grok 4.20 4.8 10.0 0.0% 0 659ms 819 83 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mistral Small 4 6.5 10.0 50.0% 0 380ms 729 69 0
Grok 4.20 6.3 10.0 50.0% 0 445ms 1,350 60 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mistral Small 4 3.1 9.9 0.0% 0 399ms 735 111 0
Grok 4.20 5.3 10.0 33.3% 0 473ms 1,671 198 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mistral Small 4 10.0 10.0 100.0% 0 1.40s 6,420 213 0
Grok 4.20 10.0 10.0 100.0% 0 4.63s 7,245 189 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mistral Small 4 3.0 10.0 0.0% 0 397ms 210 17 0
Grok 4.20 0.0 0.0 0.0% 0 0ms 0 0 0

দ্রুত তুলনা

তুলনার জুটি বদলান