নেভিগেশন
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-4o-mini vs xAI: Grok 4.20 Multi-Agent Beta

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-12

মেট্রিক GPT-4o-mini GPT-4o-mini none প্রকাশ: 2024-07-18 Grok 4.20 Multi-Agent Beta Grok 4.20 Multi-Agent Beta medium প্রকাশ: 2026-03-12
র‍্যাঙ্ক #55 #47
গড় স্কোর 4.0 4.9
ধারাবাহিকতা 10.0 7.1
প্রতি ফলাফলে খরচ 0.114 97.178
মোট খরচ $0.005 $4.859
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 25.0% 52.1%
অস্থির টেস্ট 0 6
মোট রান 48 48
আউটপুট টোকেন 1,594 293,634
রিজনিং টোকেন 0 291,260
প্রতিক্রিয়া সময় (গড়) 2.07s 9.08s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 7.58s 35.28s
প্রতিক্রিয়া সময় (মোট) 18.60s 127.09s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

গড় স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

গড় স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-4o-mini 4.0 10.0 33.3% 0 1.83s 180 0
Grok 4.20 Multi-Agent Beta 4.0 4.4 66.7% 2 3.77s 28,392 27,808
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-4o-mini 10.0 10.0 0.0% 0 7.58s 568 0
Grok 4.20 Multi-Agent Beta 10.0 10.0 0.0% 0 0ms 0 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-4o-mini 9.9 10.0 100.0% 0 1.27s 183 0
Grok 4.20 Multi-Agent Beta 9.9 10.0 100.0% 0 5.54s 25,306 25,051
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-4o-mini 10.0 10.0 0.0% 0 637ms 15 0
Grok 4.20 Multi-Agent Beta 10.0 7.2 11.1% 1 24.67s 164,609 163,647
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-4o-mini 3.0 10.0 0.0% 0 909ms 66 0
Grok 4.20 Multi-Agent Beta 4.0 2.8 66.7% 1 6.40s 15,848 15,746
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-4o-mini 4.5 10.0 0.0% 0 1.27s 69 0
Grok 4.20 Multi-Agent Beta 9.0 10.0 50.0% 0 4.63s 25,457 25,322
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-4o-mini 2.3 10.0 0.0% 0 1.30s 308 0
Grok 4.20 Multi-Agent Beta 6.3 5.1 77.8% 2 5.01s 34,022 33,686
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-4o-mini 10.0 10.0 100.0% 0 2.51s 205 0
Grok 4.20 Multi-Agent Beta 10.0 10.0 0.0% 0 0ms 0 0

দ্রুত তুলনা

তুলনার জুটি বদলান