#165

Grok Build 0.1

X AI প্রকাশ: 2026-05-21 পরীক্ষিত হয়েছে: 2026-05-21 12:40 x-ai/grok-build-0.1::none

(medium) (none)

সারাংশ

Grok Build 0.1 AI BENCHY-তে 4.2 স্কোর করে এবং #165 স্থানে আছে। এর reliability 10.0, pass rate 46.0%, মোট খরচ $0.547, এবং গড় response time 28.69s.

আর্কাইভড মডেল: এই মডেল আর আপডেট করা হবে না এবং নতুন টেস্টে পরীক্ষা করা হবে না।

স্কোর

4.2

ধারাবাহিকতা

7.5

নির্ভরযোগ্যতা

10.0

মোট খরচ (বর্তমান মূল্য)

$0.547

মোট আউটপুট টোকেন

267,275

মোট ইনপুট টোকেন

11,793

ইনপুট মূল্য

$1.000 / 1M

আউটপুট মূল্য

$2.000 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 12

প্রতি চেষ্টায় পাস রেট: 46.0%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

28.69s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 138.35s

প্রতিক্রিয়া সময় (মোট): 459.00s

ভুল উত্তর: 7 API ত্রুটি: 3 নির্দেশনা অনুসরণ করা হয়নি: 2

রান ইতিহাস

পরীক্ষিত হয়েছে	স্কোর	নির্ভরযোগ্যতা	সঠিক টেস্ট	মোট খরচ	তুলনা করুন
2026-05-21 12:40 পুনরায় পরীক্ষা	6.0	10.0		$0.547	বর্তমান রান
2026-05-21 12:40 পুনরায় পরীক্ষা	6.6	10.0		$0.547	তুলনা করুন

রান তুলনা

রান	স্কোর	ধারাবাহিকতা	নির্ভরযোগ্যতা	সঠিক টেস্ট	অস্থির টেস্ট	মোট আউটপুট টোকেন	মোট ইনপুট টোকেন	মোট খরচ	প্রতিক্রিয়া সময় (গড়)
2026-05-21 12:40 · বর্তমান রান	4.2	7.5	10.0	7/19	4	267,275	11,793	$0.547	28.69s
2026-05-21 12:40 · পুনরায় পরীক্ষা	6.6	8.0	10.0	7/16	4	267,275	0	$0.547	28.69s
পার্থক্য	-2.4	-0.5	0.0	-3	0	0	+11793	$0.000	0ms

মূল্যের ইতিহাস

OpenRouter থেকে এই মডেলের ঐতিহাসিক মূল্য তথ্য।

তারিখ	ইনপুট মূল্য	আউটপুট মূল্য
2026-06-04 15:40	$1.000 / 1M	$2.000 / 1M

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

Grok Build 0.1nonevsGemini 3.5 Flashhigh Grok Build 0.1nonevsGemini 3 Flash Previewmedium Grok Build 0.1nonevsNemotron 3 Ultra 550b A55bmediumবিনামূল্যে উপলভ্য Grok Build 0.1nonevsGPT-5.5low

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	8.7	7.9
কোডিং	3.3	3.3
সমন্বিত	3.0	10.0
ডেটা পার্সিং ও নিষ্কাশন	3.8	5.8
ডোমেইন-নির্দিষ্ট	3.6	7.2
Sadharon Buddhimotta	4.3	10.0
নির্দেশনা অনুসরণ	9.8	10.0
ধাঁধা সমাধান	6.4	7.7
টুল কলিং	3.0	10.0
সাধারণ জ্ঞান	3.0	10.0

Grok Build 0.1

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল