নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5 Nano vs Grok 4.20 Multi Agent Beta

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-04-04

মেট্রিক GPT-5 Nano GPT-5 Nano medium প্রকাশ: 2025-08-07 Grok 4.20 Multi Agent Beta Grok 4.20 Multi Agent Beta medium প্রকাশ: 2026-03-12
স্কোর 6.2 6.2
র‍্যাঙ্ক #54 #55
ধারাবাহিকতা 6.7 7.2
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 58.8% 54.9%
অস্থির টেস্ট 7 6
মোট রান 51 51
প্রতি ফলাফলে খরচ 0.864 82.962
মোট খরচ $0.061 $4.978
???? ??? $0.050 / 1M $0.000 / 1M
????? ??? $0.400 / 1M $0.000 / 1M
আউটপুট টোকেন 4,500 298,948
রিজনিং টোকেন 143,296 296,529
প্রতিক্রিয়া সময় (গড়) 44.47s 8.64s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 204.02s 35.28s
প্রতিক্রিয়া সময় (মোট) 444.74s 129.64s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5 Nano 6.5 7.9 58.3% 1 25.50s 1,221 21,184
Grok 4.20 Multi Agent Beta 6.9 5.8 75.0% 2 3.46s 33,706 33,077
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5 Nano 10.0 10.0 100.0% 0 65.96s 578 17,984
Grok 4.20 Multi Agent Beta 3.0 10.0 0.0% 0 0ms 0 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5 Nano 3.7 1.7 50.0% 2 21.42s 453 10,560
Grok 4.20 Multi Agent Beta 10.0 10.0 100.0% 0 5.54s 25,306 25,051
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5 Nano 5.2 4.4 55.6% 2 204.02s 237 64,448
Grok 4.20 Multi Agent Beta 2.9 7.2 11.1% 1 24.67s 164,609 163,647
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5 Nano 4.1 10.0 0.0% 0 17.51s 202 4,608
Grok 4.20 Multi Agent Beta 5.8 2.8 66.7% 1 6.40s 15,848 15,746
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5 Nano 8.5 6.8 83.3% 1 11.90s 382 4,096
Grok 4.20 Multi Agent Beta 8.3 10.0 50.0% 0 4.63s 25,457 25,322
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5 Nano 5.3 7.2 44.4% 1 19.81s 869 13,440
Grok 4.20 Multi Agent Beta 7.2 5.1 77.8% 2 5.01s 34,022 33,686
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5 Nano 10.0 10.0 100.0% 0 33.30s 558 6,976
Grok 4.20 Multi Agent Beta 3.0 10.0 0.0% 0 0ms 0 0

দ্রুত তুলনা

তুলনার জুটি বদলান