নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

MoonshotAI: Kimi K2.6 vs xAI: Grok 4.20

সারাংশ

Kimi K2.6 vs Grok 4.20 benchmark তুলনা: Kimi K2.6 average score-এ এগিয়ে: 7.8 vs 7.3. Grok 4.20-এর benchmark খরচ কম: $0.609 vs $0.889. Grok 4.20 দ্রুত: 27.68s vs 71.67s, pass rates 65.1% vs 63.5%.

প্রস্তাবিত মডেল: Grok 4.20 - Its score stays close to the best score here (7.3 vs 7.8), while responding about 2.6x faster than Kimi K2.6.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-18

মেট্রিক Kimi K2.6 Kimi K2.6 medium প্রকাশ: 2026-04-20 বিনামূল্যে উপলভ্য Grok 4.20 Grok 4.20 medium প্রকাশ: 2026-03-31
স্কোর 7.8 7.3
র‍্যাঙ্ক #35 #53
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.6 8.8
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 65.1% 63.5%
অস্থির টেস্ট 3 3
মোট রান 63 63
প্রতি ফলাফলে খরচ 8.358 8.309
মোট খরচ $0.889 $0.609
ইনপুট মূল্য $0.680 / 1M $1.250 / 1M
আউটপুট মূল্য $3.410 / 1M $2.500 / 1M
মোট ইনপুট টোকেন 29,450 44,433
আউটপুট টোকেন 102,923 1,819
রিজনিং টোকেন 254,094 219,524
প্রতিক্রিয়া সময় (গড়) 71.67s 27.68s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 406.78s 199.66s
প্রতিক্রিয়া সময় (মোট) 1433.36s 581.26s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#35 MoonshotAI: Kimi K2.6

medium
খরচ
$0.013
সময়
103.4s
টোকেন
3,620 tok

#53 xAI: Grok 4.20

medium
খরচ
$0.041
সময়
110.3s
টোকেন
16,336 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Kimi K2.6 7.0 8.0 66.7% 1 11.59s 618 7,115 8,934
Grok 4.20 8.2 7.9 83.3% 1 3.95s 2,010 287 8,312
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Kimi K2.6 5.7 8.6 33.3% 0 214.42s 2,925 9,970 77,189
Grok 4.20 6.3 6.6 55.6% 1 109.93s 8,307 268 103,150
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Kimi K2.6 10.0 10.0 100.0% 0 40.96s 11,271 711 13,876
Grok 4.20 10.0 10.0 100.0% 0 17.40s 12,909 232 9,556
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Kimi K2.6 10.0 10.0 100.0% 0 20.38s 7,014 316 11,305
Grok 4.20 10.0 10.0 100.0% 0 4.17s 7,761 180 5,333
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Kimi K2.6 5.3 7.2 44.4% 1 202.38s 326 47,035 98,262
Grok 4.20 5.3 10.0 33.3% 0 27.03s 1,764 375 49,339
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Kimi K2.6 10.0 10.0 100.0% 0 17.83s 477 3,981 4,472
Grok 4.20 3.9 2.6 33.3% 1 24.48s 825 65 6,440
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Kimi K2.6 10.0 10.0 100.0% 0 12.53s 669 3,977 5,269
Grok 4.20 9.8 10.0 100.0% 0 4.26s 1,362 57 6,419
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Kimi K2.6 6.0 7.4 55.6% 1 25.06s 651 13,860 17,599
Grok 4.20 7.7 10.0 66.7% 0 6.22s 1,689 149 7,913
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Kimi K2.6 10.0 10.0 100.0% 0 8.92s 5,286 248 1,011
Grok 4.20 3.0 10.0 0.0% 0 13.68s 7,275 197 6,620
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Kimi K2.6 3.0 10.0 0.0% 0 130.27s 213 15,710 16,177
Grok 4.20 3.0 10.0 0.0% 0 63.48s 531 9 16,442

দ্রুত তুলনা

তুলনার জুটি বদলান