নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 Nano vs xAI: Grok 4.20 Multi-Agent Beta

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-17

মেট্রিক GPT-5.4 Nano GPT-5.4 Nano none প্রকাশ: 2026-03-17 Grok 4.20 Multi-Agent Beta Grok 4.20 Multi-Agent Beta medium প্রকাশ: 2026-03-12
র‍্যাঙ্ক #73 #44
স্কোর 4.3 6.2
ধারাবাহিকতা 7.3 7.2
প্রতি ফলাফলে খরচ 0.404 82.962
মোট খরচ $0.009 $4.978
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 29.4% 54.9%
অস্থির টেস্ট 6 6
মোট রান 51 51
আউটপুট টোকেন 2,185 298,948
রিজনিং টোকেন 0 296,529
প্রতিক্রিয়া সময় (গড়) 1.39s 8.64s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 3.84s 35.28s
প্রতিক্রিয়া সময় (মোট) 23.70s 129.64s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Nano 3.5 8.0 16.7% 1 1.18s 800 0
Grok 4.20 Multi-Agent Beta 6.9 5.8 75.0% 2 3.46s 33,706 33,077
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Nano 3.0 10.0 0.0% 0 3.84s 280 0
Grok 4.20 Multi-Agent Beta 3.0 10.0 0.0% 0 0ms 0 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Nano 6.5 10.0 50.0% 0 1.11s 219 0
Grok 4.20 Multi-Agent Beta 10.0 10.0 100.0% 0 5.54s 25,306 25,051
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Nano 2.9 4.4 22.2% 2 926ms 52 0
Grok 4.20 Multi-Agent Beta 2.9 7.2 11.1% 1 24.67s 164,609 163,647
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Nano 3.8 2.5 33.3% 1 1.31s 180 0
Grok 4.20 Multi-Agent Beta 5.8 2.8 66.7% 1 6.40s 15,848 15,746
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Nano 5.0 6.8 33.3% 1 787ms 84 0
Grok 4.20 Multi-Agent Beta 8.3 10.0 50.0% 0 4.63s 25,457 25,322
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Nano 3.7 7.3 22.2% 1 1.29s 348 0
Grok 4.20 Multi-Agent Beta 7.2 5.1 77.8% 2 5.01s 34,022 33,686
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Nano 10.0 10.0 100.0% 0 3.40s 222 0
Grok 4.20 Multi-Agent Beta 3.0 10.0 0.0% 0 0ms 0 0

দ্রুত তুলনা

তুলনার জুটি বদলান