#82

Grok Build 0.1

X AI প্রকাশ: 2026-05-21 পরীক্ষিত হয়েছে: 2026-05-21 12:40 x-ai/grok-build-0.1::none

(medium) (none)

সারাংশ

Grok Build 0.1 AI BENCHY-তে 6.6 স্কোর করে এবং #82 স্থানে আছে। এর reliability 10.0, pass rate 60.4%, মোট খরচ $0.547, এবং গড় response time 28.69s.

Grok Build 0.1 কে আলাদা করে যা: এটি কোডিং-তে সবচেয়ে ভালোভাবে নজর কাড়ে, যেখানে এর rank #1; আর সমন্বিত এর দুর্বলতম ক্ষেত্র, rank #13.

আর্কাইভড মডেল: এই মডেল আর আপডেট করা হবে না এবং নতুন টেস্টে পরীক্ষা করা হবে না।

স্কোর

6.6

ধারাবাহিকতা

8.0

নির্ভরযোগ্যতা

10.0

মোট খরচ (বর্তমান মূল্য)

$0.547

মোট আউটপুট টোকেন

267,275

মোট ইনপুট টোকেন

ইনপুট মূল্য

$1.000 / 1M

আউটপুট মূল্য

$2.000 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 9

প্রতি চেষ্টায় পাস রেট: 60.4%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

28.69s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 138.35s

প্রতিক্রিয়া সময় (মোট): 459.00s

ভুল উত্তর: 7 নির্দেশনা অনুসরণ করা হয়নি: 2

রান ইতিহাস

পরীক্ষিত হয়েছে	স্কোর	নির্ভরযোগ্যতা	সঠিক টেস্ট	মোট খরচ	তুলনা করুন
2026-05-21 12:40 পুনরায় পরীক্ষা	6.0	10.0		$0.547	তুলনা করুন
2026-05-21 12:40 পুনরায় পরীক্ষা	6.6	10.0		$0.547	বর্তমান রান

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

Grok Build 0.1nonevsGemini 3.5 Flashhigh Grok Build 0.1nonevsGemini 3 Flash Previewmedium Grok Build 0.1nonevsNemotron 3 Ultra 550b A55bmediumবিনামূল্যে উপলভ্য Grok Build 0.1nonevsGPT-5.5low

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	8.7	7.9
কোডিং	10.0	10.0
সমন্বিত	0.0	0.0
ডেটা পার্সিং ও নিষ্কাশন	4.7	1.6
ডোমেইন-নির্দিষ্ট	3.6	7.2
Sadharon Buddhimotta	4.3	10.0
নির্দেশনা অনুসরণ	9.8	10.0
ধাঁধা সমাধান	6.4	7.7
টুল কলিং	0.0	0.0
সাধারণ জ্ঞান	3.0	10.0

Grok Build 0.1

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল