AI BENCHY
Advertise here
#165

Grok Build 0.1

X AI প্রকাশ: 2026-05-21 পরীক্ষিত হয়েছে: 2026-05-21 12:40 x-ai/grok-build-0.1::none
(medium) (none)

সারাংশ

Grok Build 0.1 AI BENCHY-তে 4.2 স্কোর করে এবং #165 স্থানে আছে। এর reliability 10.0, pass rate 46.0%, মোট খরচ $0.547, এবং গড় response time 28.69s.

আর্কাইভড মডেল: এই মডেল আর আপডেট করা হবে না এবং নতুন টেস্টে পরীক্ষা করা হবে না।

ধারাবাহিকতা

7.5

মোট আউটপুট টোকেন

267,275

মোট ইনপুট টোকেন

11,793

ইনপুট মূল্য

$1.000 / 1M

আউটপুট মূল্য

$2.000 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 12

প্রতি চেষ্টায় পাস রেট: 46.0%

অস্থির টেস্ট

4

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

28.69s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 138.35s

প্রতিক্রিয়া সময় (মোট): 459.00s

রান ইতিহাস

পরীক্ষিত হয়েছে স্কোর নির্ভরযোগ্যতা সঠিক টেস্ট মোট খরচ তুলনা করুন
2026-05-21 12:40 পুনরায় পরীক্ষা 6.0 10.0 $0.547 বর্তমান রান
2026-05-21 12:40 পুনরায় পরীক্ষা 6.6 10.0 $0.547 তুলনা করুন

মূল্যের ইতিহাস

OpenRouter থেকে এই মডেলের ঐতিহাসিক মূল্য তথ্য।

তারিখ ইনপুট মূল্য আউটপুট মূল্য
2026-06-04 15:40 $1.000 / 1M $2.000 / 1M

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ স্কোর ধারাবাহিকতা সঠিক টেস্ট
অ্যান্টি-এআই কৌশল 8.7 7.9
কোডিং 3.3 3.3
সমন্বিত 3.0 10.0
ডেটা পার্সিং ও নিষ্কাশন 3.8 5.8
ডোমেইন-নির্দিষ্ট 3.6 7.2
Sadharon Buddhimotta 4.3 10.0
নির্দেশনা অনুসরণ 9.8 10.0
ধাঁধা সমাধান 6.4 7.7
টুল কলিং 3.0 10.0
সাধারণ জ্ঞান 3.0 10.0

তুলনা করা মডেল