GPT-5.5 vs Grok 4.20 Multi Agent Beta benchmark তুলনা: GPT-5.5 average score-এ এগিয়ে: 9.3 vs 5.0. GPT-5.5-এর benchmark খরচ কম: $0.907 vs $5.599. Grok 4.20 Multi Agent Beta দ্রুত: 9.69s vs 9.76s, pass rates 85.7% vs 50.8%.
প্রস্তাবিত মডেল: GPT-5.5 - It has the best score here (9.3), while costing about 6.2x less than Grok 4.20 Multi Agent Beta.
AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-18
10.0প্রথম প্রচেষ্টার সফলতা স্কোর: 10.0 মানে সফল কলের আগে লক্ষ্য API বা রেট-লিমিটের কোনো পুনরায় চেষ্টা-যোগ্য ব্যর্থতা নেই; ট্র্যাক করা ব্যর্থতা স্কোর কমায়।…
প্রযোজ্য নয়প্রথম প্রচেষ্টার সফলতা স্কোর: 10.0 মানে সফল কলের আগে লক্ষ্য API বা রেট-লিমিটের কোনো পুনরায় চেষ্টা-যোগ্য ব্যর্থতা নেই; ট্র্যাক করা ব্যর্থতা স্কোর কমায়।…
ধারাবাহিকতা
10.0ধারাবাহিকতা স্কোর রানগুলোর মধ্যে স্থিতিশীলতা দেখায় (10 = খুব স্থিতিশীল, ভুল হলেও ধারাবাহিকভাবে ভুল)।…
6.7ধারাবাহিকতা স্কোর রানগুলোর মধ্যে স্থিতিশীলতা দেখায় (10 = খুব স্থিতিশীল, ভুল হলেও ধারাবাহিকভাবে ভুল)।…
সঠিক টেস্ট
একটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।ভুল উত্তর: 3প্রতিক্রিয়া সময় (গড়)9.76sপ্রতিক্রিয়া সময় (সর্বোচ্চ)56.19sপ্রতিক্রিয়া সময় (মোট)204.92sএকটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।…
10.0ধারাবাহিকতা স্কোর রানগুলোর মধ্যে স্থিতিশীলতা দেখায় (10 = খুব স্থিতিশীল, ভুল হলেও ধারাবাহিকভাবে ভুল)।…
100.0%প্রতি চেষ্টায় পাস রেট = পাস করা চেষ্টা / সব রান মিলিয়ে মোট চেষ্টা।…
0অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।…
একটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।কোনো ব্যর্থ উত্তর নেই।প্রতিক্রিয়া সময় (গড়)4.41sপ্রতিক্রিয়া সময় (সর্বোচ্চ)6.32sপ্রতিক্রিয়া সময় (মোট)17.64sএকটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।…
4.41sপ্রতিক্রিয়া সময় (গড়)…
606মোট ইনপুট টোকেন…
238আউটপুট টোকেন…
1,020রিজনিং টোকেন…
Grok 4.20 Multi Agent Betaআর্কাইভড মডেল: এই মডেল আর আপডেট করা হবে না এবং নতুন টেস্টে পরীক্ষা করা হবে না।
6.9সব বেঞ্চমার্ক টেস্টে গড় স্কোর।…
5.8ধারাবাহিকতা স্কোর রানগুলোর মধ্যে স্থিতিশীলতা দেখায় (10 = খুব স্থিতিশীল, ভুল হলেও ধারাবাহিকভাবে ভুল)।…
75.0%প্রতি চেষ্টায় পাস রেট = পাস করা চেষ্টা / সব রান মিলিয়ে মোট চেষ্টা।…
2অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।…
একটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।অতিরিক্ত ফরম্যাটিং: 1ভুল উত্তর: 1প্রতিক্রিয়া সময় (গড়)3.46sপ্রতিক্রিয়া সময় (সর্বোচ্চ)4.38sপ্রতিক্রিয়া সময় (মোট)13.86sএকটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।…
10.0ধারাবাহিকতা স্কোর রানগুলোর মধ্যে স্থিতিশীলতা দেখায় (10 = খুব স্থিতিশীল, ভুল হলেও ধারাবাহিকভাবে ভুল)।…
100.0%প্রতি চেষ্টায় পাস রেট = পাস করা চেষ্টা / সব রান মিলিয়ে মোট চেষ্টা।…
0অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।…
একটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।কোনো ব্যর্থ উত্তর নেই।প্রতিক্রিয়া সময় (গড়)15.04sপ্রতিক্রিয়া সময় (সর্বোচ্চ)21.06sপ্রতিক্রিয়া সময় (মোট)45.11sএকটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।…
15.04sপ্রতিক্রিয়া সময় (গড়)…
7,302মোট ইনপুট টোকেন…
423আউটপুট টোকেন…
6,402রিজনিং টোকেন…
Grok 4.20 Multi Agent Betaআর্কাইভড মডেল: এই মডেল আর আপডেট করা হবে না এবং নতুন টেস্টে পরীক্ষা করা হবে না।
3.3সব বেঞ্চমার্ক টেস্টে গড় স্কোর।…
3.3ধারাবাহিকতা স্কোর রানগুলোর মধ্যে স্থিতিশীলতা দেখায় (10 = খুব স্থিতিশীল, ভুল হলেও ধারাবাহিকভাবে ভুল)।…
33.3%প্রতি চেষ্টায় পাস রেট = পাস করা চেষ্টা / সব রান মিলিয়ে মোট চেষ্টা।…
0অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।…
একটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।কোনো ব্যর্থ উত্তর নেই।প্রতিক্রিয়া সময় (গড়)27.11sপ্রতিক্রিয়া সময় (সর্বোচ্চ)27.11sপ্রতিক্রিয়া সময় (মোট)27.11sএকটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।…
10.0ধারাবাহিকতা স্কোর রানগুলোর মধ্যে স্থিতিশীলতা দেখায় (10 = খুব স্থিতিশীল, ভুল হলেও ধারাবাহিকভাবে ভুল)।…
100.0%প্রতি চেষ্টায় পাস রেট = পাস করা চেষ্টা / সব রান মিলিয়ে মোট চেষ্টা।…
0অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।…
একটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।কোনো ব্যর্থ উত্তর নেই।প্রতিক্রিয়া সময় (গড়)9.56sপ্রতিক্রিয়া সময় (সর্বোচ্চ)9.56sপ্রতিক্রিয়া সময় (মোট)9.56sএকটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।…
9.56sপ্রতিক্রিয়া সময় (গড়)…
11,019মোট ইনপুট টোকেন…
303আউটপুট টোকেন…
717রিজনিং টোকেন…
Grok 4.20 Multi Agent Betaআর্কাইভড মডেল: এই মডেল আর আপডেট করা হবে না এবং নতুন টেস্টে পরীক্ষা করা হবে না।
3.0সব বেঞ্চমার্ক টেস্টে গড় স্কোর।…
10.0ধারাবাহিকতা স্কোর রানগুলোর মধ্যে স্থিতিশীলতা দেখায় (10 = খুব স্থিতিশীল, ভুল হলেও ধারাবাহিকভাবে ভুল)।…
0.0%প্রতি চেষ্টায় পাস রেট = পাস করা চেষ্টা / সব রান মিলিয়ে মোট চেষ্টা।…
0অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।…
একটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।API ত্রুটি: 1প্রতিক্রিয়া সময় (গড়)0msপ্রতিক্রিয়া সময় (সর্বোচ্চ)0msপ্রতিক্রিয়া সময় (মোট)0msএকটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।…
10.0ধারাবাহিকতা স্কোর রানগুলোর মধ্যে স্থিতিশীলতা দেখায় (10 = খুব স্থিতিশীল, ভুল হলেও ধারাবাহিকভাবে ভুল)।…
100.0%প্রতি চেষ্টায় পাস রেট = পাস করা চেষ্টা / সব রান মিলিয়ে মোট চেষ্টা।…
0অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।…
একটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।কোনো ব্যর্থ উত্তর নেই।প্রতিক্রিয়া সময় (গড়)3.28sপ্রতিক্রিয়া সময় (সর্বোচ্চ)5.13sপ্রতিক্রিয়া সময় (মোট)6.56sএকটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।…
3.28sপ্রতিক্রিয়া সময় (গড়)…
7,140মোট ইনপুট টোকেন…
228আউটপুট টোকেন…
157রিজনিং টোকেন…
Grok 4.20 Multi Agent Betaআর্কাইভড মডেল: এই মডেল আর আপডেট করা হবে না এবং নতুন টেস্টে পরীক্ষা করা হবে না।
10.0সব বেঞ্চমার্ক টেস্টে গড় স্কোর।…
10.0ধারাবাহিকতা স্কোর রানগুলোর মধ্যে স্থিতিশীলতা দেখায় (10 = খুব স্থিতিশীল, ভুল হলেও ধারাবাহিকভাবে ভুল)।…
100.0%প্রতি চেষ্টায় পাস রেট = পাস করা চেষ্টা / সব রান মিলিয়ে মোট চেষ্টা।…
0অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।…
একটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।কোনো ব্যর্থ উত্তর নেই।প্রতিক্রিয়া সময় (গড়)5.54sপ্রতিক্রিয়া সময় (সর্বোচ্চ)7.51sপ্রতিক্রিয়া সময় (মোট)11.08sএকটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।…
10.0ধারাবাহিকতা স্কোর রানগুলোর মধ্যে স্থিতিশীলতা দেখায় (10 = খুব স্থিতিশীল, ভুল হলেও ধারাবাহিকভাবে ভুল)।…
33.3%প্রতি চেষ্টায় পাস রেট = পাস করা চেষ্টা / সব রান মিলিয়ে মোট চেষ্টা।…
0অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।…
একটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।ভুল উত্তর: 2প্রতিক্রিয়া সময় (গড়)28.05sপ্রতিক্রিয়া সময় (সর্বোচ্চ)56.19sপ্রতিক্রিয়া সময় (মোট)84.16sএকটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।…
28.05sপ্রতিক্রিয়া সময় (গড়)…
723মোট ইনপুট টোকেন…
69আউটপুট টোকেন…
11,609রিজনিং টোকেন…
Grok 4.20 Multi Agent Betaআর্কাইভড মডেল: এই মডেল আর আপডেট করা হবে না এবং নতুন টেস্টে পরীক্ষা করা হবে না।
2.9সব বেঞ্চমার্ক টেস্টে গড় স্কোর।…
7.2ধারাবাহিকতা স্কোর রানগুলোর মধ্যে স্থিতিশীলতা দেখায় (10 = খুব স্থিতিশীল, ভুল হলেও ধারাবাহিকভাবে ভুল)।…
11.1%প্রতি চেষ্টায় পাস রেট = পাস করা চেষ্টা / সব রান মিলিয়ে মোট চেষ্টা।…
1অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।…
একটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।ভুল উত্তর: 2অতিরিক্ত ফরম্যাটিং: 1প্রতিক্রিয়া সময় (গড়)24.67sপ্রতিক্রিয়া সময় (সর্বোচ্চ)35.28sপ্রতিক্রিয়া সময় (মোট)74.02sএকটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।…
10.0ধারাবাহিকতা স্কোর রানগুলোর মধ্যে স্থিতিশীলতা দেখায় (10 = খুব স্থিতিশীল, ভুল হলেও ধারাবাহিকভাবে ভুল)।…
100.0%প্রতি চেষ্টায় পাস রেট = পাস করা চেষ্টা / সব রান মিলিয়ে মোট চেষ্টা।…
0অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।…
একটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।কোনো ব্যর্থ উত্তর নেই।প্রতিক্রিয়া সময় (গড়)5.17sপ্রতিক্রিয়া সময় (সর্বোচ্চ)5.17sপ্রতিক্রিয়া সময় (মোট)5.17sএকটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।…
5.17sপ্রতিক্রিয়া সময় (গড়)…
477মোট ইনপুট টোকেন…
133আউটপুট টোকেন…
245রিজনিং টোকেন…
Grok 4.20 Multi Agent Betaআর্কাইভড মডেল: এই মডেল আর আপডেট করা হবে না এবং নতুন টেস্টে পরীক্ষা করা হবে না।
5.8সব বেঞ্চমার্ক টেস্টে গড় স্কোর।…
2.8ধারাবাহিকতা স্কোর রানগুলোর মধ্যে স্থিতিশীলতা দেখায় (10 = খুব স্থিতিশীল, ভুল হলেও ধারাবাহিকভাবে ভুল)।…
66.7%প্রতি চেষ্টায় পাস রেট = পাস করা চেষ্টা / সব রান মিলিয়ে মোট চেষ্টা।…
1অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।…
একটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।নির্দেশনা অনুসরণ করা হয়নি: 1প্রতিক্রিয়া সময় (গড়)6.40sপ্রতিক্রিয়া সময় (সর্বোচ্চ)6.40sপ্রতিক্রিয়া সময় (মোট)6.40sএকটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।…
10.0ধারাবাহিকতা স্কোর রানগুলোর মধ্যে স্থিতিশীলতা দেখায় (10 = খুব স্থিতিশীল, ভুল হলেও ধারাবাহিকভাবে ভুল)।…
100.0%প্রতি চেষ্টায় পাস রেট = পাস করা চেষ্টা / সব রান মিলিয়ে মোট চেষ্টা।…
0অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।…
একটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।কোনো ব্যর্থ উত্তর নেই।প্রতিক্রিয়া সময় (গড়)3.74sপ্রতিক্রিয়া সময় (সর্বোচ্চ)3.99sপ্রতিক্রিয়া সময় (মোট)7.48sএকটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।…
3.74sপ্রতিক্রিয়া সময় (গড়)…
660মোট ইনপুট টোকেন…
93আউটপুট টোকেন…
415রিজনিং টোকেন…
Grok 4.20 Multi Agent Betaআর্কাইভড মডেল: এই মডেল আর আপডেট করা হবে না এবং নতুন টেস্টে পরীক্ষা করা হবে না।
9.8সব বেঞ্চমার্ক টেস্টে গড় স্কোর।…
10.0ধারাবাহিকতা স্কোর রানগুলোর মধ্যে স্থিতিশীলতা দেখায় (10 = খুব স্থিতিশীল, ভুল হলেও ধারাবাহিকভাবে ভুল)।…
100.0%প্রতি চেষ্টায় পাস রেট = পাস করা চেষ্টা / সব রান মিলিয়ে মোট চেষ্টা।…
0অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।…
একটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।কোনো ব্যর্থ উত্তর নেই।প্রতিক্রিয়া সময় (গড়)3.52sপ্রতিক্রিয়া সময় (সর্বোচ্চ)3.80sপ্রতিক্রিয়া সময় (মোট)7.04sএকটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।…
10.0ধারাবাহিকতা স্কোর রানগুলোর মধ্যে স্থিতিশীলতা দেখায় (10 = খুব স্থিতিশীল, ভুল হলেও ধারাবাহিকভাবে ভুল)।…
100.0%প্রতি চেষ্টায় পাস রেট = পাস করা চেষ্টা / সব রান মিলিয়ে মোট চেষ্টা।…
0অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।…
একটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।কোনো ব্যর্থ উত্তর নেই।প্রতিক্রিয়া সময় (গড়)4.74sপ্রতিক্রিয়া সময় (সর্বোচ্চ)5.61sপ্রতিক্রিয়া সময় (মোট)14.21sএকটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।…
4.74sপ্রতিক্রিয়া সময় (গড়)…
642মোট ইনপুট টোকেন…
279আউটপুট টোকেন…
954রিজনিং টোকেন…
Grok 4.20 Multi Agent Betaআর্কাইভড মডেল: এই মডেল আর আপডেট করা হবে না এবং নতুন টেস্টে পরীক্ষা করা হবে না।
6.7সব বেঞ্চমার্ক টেস্টে গড় স্কোর।…
7.9ধারাবাহিকতা স্কোর রানগুলোর মধ্যে স্থিতিশীলতা দেখায় (10 = খুব স্থিতিশীল, ভুল হলেও ধারাবাহিকভাবে ভুল)।…
55.6%প্রতি চেষ্টায় পাস রেট = পাস করা চেষ্টা / সব রান মিলিয়ে মোট চেষ্টা।…
1অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।…
একটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।নির্দেশনা অনুসরণ করা হয়নি: 1ভুল উত্তর: 1প্রতিক্রিয়া সময় (গড়)5.19sপ্রতিক্রিয়া সময় (সর্বোচ্চ)5.49sপ্রতিক্রিয়া সময় (মোট)15.57sএকটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।…
10.0ধারাবাহিকতা স্কোর রানগুলোর মধ্যে স্থিতিশীলতা দেখায় (10 = খুব স্থিতিশীল, ভুল হলেও ধারাবাহিকভাবে ভুল)।…
100.0%প্রতি চেষ্টায় পাস রেট = পাস করা চেষ্টা / সব রান মিলিয়ে মোট চেষ্টা।…
0অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।…
একটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।কোনো ব্যর্থ উত্তর নেই।প্রতিক্রিয়া সময় (গড়)4.96sপ্রতিক্রিয়া সময় (সর্বোচ্চ)4.96sপ্রতিক্রিয়া সময় (মোট)4.96sএকটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।…
4.96sপ্রতিক্রিয়া সময় (গড়)…
5,445মোট ইনপুট টোকেন…
250আউটপুট টোকেন…
101রিজনিং টোকেন…
Grok 4.20 Multi Agent Betaআর্কাইভড মডেল: এই মডেল আর আপডেট করা হবে না এবং নতুন টেস্টে পরীক্ষা করা হবে না।
3.0সব বেঞ্চমার্ক টেস্টে গড় স্কোর।…
10.0ধারাবাহিকতা স্কোর রানগুলোর মধ্যে স্থিতিশীলতা দেখায় (10 = খুব স্থিতিশীল, ভুল হলেও ধারাবাহিকভাবে ভুল)।…
0.0%প্রতি চেষ্টায় পাস রেট = পাস করা চেষ্টা / সব রান মিলিয়ে মোট চেষ্টা।…
0অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।…
একটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।API ত্রুটি: 1প্রতিক্রিয়া সময় (গড়)0msপ্রতিক্রিয়া সময় (সর্বোচ্চ)0msপ্রতিক্রিয়া সময় (মোট)0msএকটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।…
10.0ধারাবাহিকতা স্কোর রানগুলোর মধ্যে স্থিতিশীলতা দেখায় (10 = খুব স্থিতিশীল, ভুল হলেও ধারাবাহিকভাবে ভুল)।…
0.0%প্রতি চেষ্টায় পাস রেট = পাস করা চেষ্টা / সব রান মিলিয়ে মোট চেষ্টা।…
0অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।…
একটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।ভুল উত্তর: 1প্রতিক্রিয়া সময় (গড়)10.06sপ্রতিক্রিয়া সময় (সর্বোচ্চ)10.06sপ্রতিক্রিয়া সময় (মোট)10.06sএকটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।…
10.06sপ্রতিক্রিয়া সময় (গড়)…
195মোট ইনপুট টোকেন…
30আউটপুট টোকেন…
840রিজনিং টোকেন…
Grok 4.20 Multi Agent Betaআর্কাইভড মডেল: এই মডেল আর আপডেট করা হবে না এবং নতুন টেস্টে পরীক্ষা করা হবে না।
0.0সব বেঞ্চমার্ক টেস্টে গড় স্কোর।…
0.0ধারাবাহিকতা স্কোর রানগুলোর মধ্যে স্থিতিশীলতা দেখায় (10 = খুব স্থিতিশীল, ভুল হলেও ধারাবাহিকভাবে ভুল)।…
0.0%প্রতি চেষ্টায় পাস রেট = পাস করা চেষ্টা / সব রান মিলিয়ে মোট চেষ্টা।…
0অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।…
একটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।কোনো ব্যর্থ উত্তর নেই।প্রতিক্রিয়া সময় (গড়)0msপ্রতিক্রিয়া সময় (সর্বোচ্চ)0msপ্রতিক্রিয়া সময় (মোট)0msএকটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।…