নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Mistral: Mistral Small 4 vs Z.ai: GLM 4.7 Flash

সারাংশ

Mistral Small 4 vs GLM 4.7 Flash benchmark তুলনা: Mistral Small 4 average score-এ এগিয়ে: 5.1 vs 4.3. Mistral Small 4-এর benchmark খরচ কম: $0.007 vs $0.054. Mistral Small 4 দ্রুত: 630ms vs 35.10s, pass rates 27.0% vs 33.3%.

প্রস্তাবিত মডেল: Mistral Small 4 - It has the best score here (5.1), while costing about 7.7x less than GLM 4.7 Flash.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-12

মেট্রিক Mistral Small 4 Mistral Small 4 none প্রকাশ: 2026-03-16 GLM 4.7 Flash GLM 4.7 Flash medium প্রকাশ: 2026-01-19
স্কোর 5.1 4.3
র‍্যাঙ্ক #136 #159
নির্ভরযোগ্যতা 10.0 6.7
ধারাবাহিকতা 9.5 6.8
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 27.0% 33.3%
অস্থির টেস্ট 1 8
মোট রান 63 63
প্রতি ফলাফলে খরচ 0.139 1.337
মোট খরচ $0.007 $0.054
ইনপুট মূল্য $0.150 / 1M $0.060 / 1M
আউটপুট মূল্য $0.600 / 1M $0.400 / 1M
মোট ইনপুট টোকেন 37,309 37,206
আউটপুট টোকেন 2,201 43,754
রিজনিং টোকেন 0 89,079
প্রতিক্রিয়া সময় (গড়) 630ms 35.10s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 1.72s 174.55s
প্রতিক্রিয়া সময় (মোট) 13.22s 456.24s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#136 Mistral Small 4

none
Cost
$0.002
Time
10.4s
Tokens
2,370 tok

#159 GLM 4.7 Flash

medium
Invalid SVG
Cost
$0.000
Time
186.2s
Tokens
12,112 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mistral Small 4 3.4 7.9 16.7% 1 395ms 708 182 0
GLM 4.7 Flash 4.7 5.9 41.7% 2 14.95s 555 1,122 6,110
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mistral Small 4 3.7 9.7 0.0% 0 901ms 7,636 619 0
GLM 4.7 Flash 3.2 7.4 11.1% 1 55.33s 3,106 4,981 22,387
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mistral Small 4 3.0 10.0 0.0% 0 1.72s 11,640 496 0
GLM 4.7 Flash 2.8 2.1 33.3% 1 65.57s 17,185 2,585 20,648
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mistral Small 4 10.0 10.0 100.0% 0 822ms 7,914 261 0
GLM 4.7 Flash 6.3 10.0 50.0% 0 1.51s 7,107 584 2,755
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mistral Small 4 5.3 10.0 33.3% 0 367ms 798 28 0
GLM 4.7 Flash 3.5 4.4 33.3% 2 174.55s 643 33,000 25,394
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mistral Small 4 4.0 10.0 0.0% 0 729ms 519 205 0
GLM 4.7 Flash 3.6 9.7 0.0% 0 18.14s 318 18 2,138
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mistral Small 4 6.5 10.0 50.0% 0 380ms 729 69 0
GLM 4.7 Flash 6.2 5.8 66.7% 1 2.97s 636 388 2,181
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mistral Small 4 3.1 9.9 0.0% 0 399ms 735 111 0
GLM 4.7 Flash 2.9 7.2 11.1% 1 12.93s 521 781 5,255
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mistral Small 4 10.0 10.0 100.0% 0 1.40s 6,420 213 0
GLM 4.7 Flash 10.0 10.0 100.0% 0 15.95s 6,949 224 1,014
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mistral Small 4 3.0 10.0 0.0% 0 397ms 210 17 0
GLM 4.7 Flash 3.0 10.0 0.0% 0 11.13s 186 71 1,197

দ্রুত তুলনা

তুলনার জুটি বদলান