নেভিগেশন
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5 Mini vs xAI: Grok 4.20 Beta

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-12

মেট্রিক GPT-5 Mini GPT-5 Mini medium প্রকাশ: 2025-08-07 Grok 4.20 Beta Grok 4.20 Beta none প্রকাশ: 2026-03-12
র‍্যাঙ্ক #34 #52
গড় স্কোর 6.0 4.4
ধারাবাহিকতা 8.9 9.1
প্রতি ফলাফলে খরচ 1.457 2.214
মোট খরচ $0.117 $0.089
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 58.3% 33.3%
অস্থির টেস্ট 2 2
মোট রান 48 48
আউটপুট টোকেন 5,826 1,511
রিজনিং টোকেন 48,768 0
প্রতিক্রিয়া সময় (গড়) 25.14s 1.22s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 88.15s 6.48s
প্রতিক্রিয়া সময় (মোট) 402.29s 19.53s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

গড় স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

গড় স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5 Mini 7.0 9.6 66.7% 0 16.45s 1,645 5,824
Grok 4.20 Beta 3.3 7.9 22.2% 1 562ms 245 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5 Mini 10.0 10.0 100.0% 0 88.15s 754 11,520
Grok 4.20 Beta 10.0 10.0 0.0% 0 6.48s 282 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5 Mini 9.9 10.0 100.0% 0 12.58s 453 3,200
Grok 4.20 Beta 9.9 10.0 100.0% 0 601ms 197 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5 Mini 10.0 7.2 22.2% 1 44.63s 293 14,016
Grok 4.20 Beta 10.0 10.0 0.0% 0 611ms 160 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5 Mini 4.0 10.0 0.0% 0 13.50s 349 1,856
Grok 4.20 Beta 5.0 10.0 0.0% 0 541ms 87 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5 Mini 7.5 6.6 83.3% 1 15.66s 318 4,992
Grok 4.20 Beta 4.5 10.0 0.0% 0 687ms 60 0
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5 Mini 4.3 9.8 33.3% 0 14.09s 1,527 5,760
Grok 4.20 Beta 4.0 7.2 55.6% 1 541ms 291 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5 Mini 10.0 10.0 100.0% 0 18.64s 487 1,600
Grok 4.20 Beta 10.0 10.0 100.0% 0 4.79s 189 0

দ্রুত তুলনা

তুলনার জুটি বদলান