#83

Grok 4.3

X AI প্রকাশ: 2026-05-01 পরীক্ষিত হয়েছে: 2026-07-16 23:07 x-ai/grok-4.3::medium

সারাংশ

Grok 4.3 AI BENCHY-তে 7.1 স্কোর করে এবং #83 স্থানে আছে। এর reliability 10.0, pass rate 68.2%, মোট খরচ $0.779, এবং গড় response time 47.45s.

স্কোর

7.1

ধারাবাহিকতা

8.6

নির্ভরযোগ্যতা

10.0

মোট খরচ (বর্তমান মূল্য)

$0.779

মোট আউটপুট টোকেন

241,421

মোট ইনপুট টোকেন

140,031

ইনপুট মূল্য

$1.250 / 1M

আউটপুট মূল্য

$2.500 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 9

প্রতি চেষ্টায় পাস রেট: 68.2%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

47.45s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 216.69s

প্রতিক্রিয়া সময় (মোট): 1043.83s

ভুল উত্তর: 5 নির্দেশনা অনুসরণ করা হয়নি: 2 অতিরিক্ত ফরম্যাটিং: 1 কোন উত্তর নেই: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#83 xAI: Grok 4.3

medium

খরচ: $0.009
সময়: 19.0s
টোকেন: 3,661 tok

রান ইতিহাস

পরীক্ষিত হয়েছে	স্কোর	নির্ভরযোগ্যতা	মোট খরচ	তুলনা করুন
2026-07-16 23:07 নতুন টেস্ট যোগ হয়েছে	7.1	10.0	$0.779	বর্তমান রান
2026-06-04 14:11 নতুন টেস্ট যোগ হয়েছে	7.6	10.0	$0.614	তুলনা করুন
2026-05-22 00:32 পুনরায় পরীক্ষা	7.8	10.0	$0.593	তুলনা করুন
2026-05-01 00:40 প্রথম রান	8.2	10.0	$0.517	তুলনা করুন

এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।

মূল্যের ইতিহাস

OpenRouter থেকে এই মডেলের ঐতিহাসিক মূল্য তথ্য।

তারিখ	ইনপুট মূল্য	আউটপুট মূল্য
2026-06-04 15:40	$1.250 / 1M	$2.500 / 1M

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

Grok 4.3mediumvsQwen3.5-122B-A10Bmedium Grok 4.3mediumvsGLM 5.1medium Grok 4.3mediumvsQwen3.7 Plusnone Grok 4.3mediumvsGrok 4.20medium Grok 4.3mediumvsQwen3.5 Plus 2026-04-20medium Grok 4.3mediumvsDeepSeek V3.2medium Grok 4.3mediumvsKAT-Coder-Pro V2.5high Grok 4.3mediumvsKimi K2.5medium Grok 4.3mediumvsKimi K2.6medium Grok 4.3mediumvsMercury 2medium

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	10.0	10.0
কোডিং	5.9	7.7
সমন্বিত	6.5	10.0
ডেটা পার্সিং ও নিষ্কাশন	10.0	10.0
ডোমেইন-নির্দিষ্ট	5.3	7.2
Sadharon Buddhimotta	5.4	2.5
নির্দেশনা অনুসরণ	9.8	10.0
ধাঁধা সমাধান	5.9	7.2
টুল কলিং	10.0	10.0
সাধারণ জ্ঞান	3.0	10.0

Grok 4.3

Hamster playing table tennis

#83 xAI: Grok 4.3

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল