নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

Cobuddy vs xAI: Grok 4.20

সারাংশ

Cobuddy vs Grok 4.20 benchmark তুলনা: Cobuddy average score-এ এগিয়ে: 4.9 vs 4.4. Cobuddy-এর benchmark খরচ কম: $0.000 vs $0.057. Grok 4.20 দ্রুত: 1.11s vs 39.90s, pass rates 47.6% vs 28.6%.

প্রস্তাবিত মডেল: Cobuddy - It has the strongest score in this comparison (4.9) and the best overall balance of cost and response time across all 2 models.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-07-02

মেট্রিক Cobuddy Cobuddy medium প্রকাশ: 2026-05-06 Grok 4.20 Grok 4.20 none প্রকাশ: 2026-03-31
স্কোর 4.9 4.4
র‍্যাঙ্ক #145 #160
নির্ভরযোগ্যতা 10.0 প্রযোজ্য নয়
ধারাবাহিকতা 7.5 8.5
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 47.6% 28.6%
অস্থির টেস্ট 6 0
মোট রান 63 54
প্রতি ফলাফলে খরচ 0.000 1.570
মোট খরচ $0.000 $0.057
ইনপুট মূল্য $0.000 / 1M $1.250 / 1M
আউটপুট মূল্য $0.000 / 1M $2.500 / 1M
মোট ইনপুট টোকেন 37,449 41,313
আউটপুট টোকেন 1,677 1,923
রিজনিং টোকেন 116,703 0
প্রতিক্রিয়া সময় (গড়) 39.90s 1.11s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 309.02s 6.04s
প্রতিক্রিয়া সময় (মোট) 797.98s 19.96s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#145 Cobuddy

medium
No endpoints found for baidu/cobuddy:free.
খরচ
$0.000
সময়
0.1s
টোকেন
0 tok

#160 xAI: Grok 4.20

none
খরচ
$0.004
সময়
6.5s
টোকেন
1,367 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Cobuddy 8.7 7.9 91.7% 1 10.00s 453 98 4,666
Grok 4.20 4.8 10.0 25.0% 0 501ms 1,986 267 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Cobuddy 3.7 6.7 22.2% 1 79.17s 4,726 358 30,138
Grok 4.20 1.1 3.1 0.0% 0 1.22s 1,074 312 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Cobuddy 3.0 10.0 0.0% 0 47.38s 18,324 465 7,265
Grok 4.20 3.0 10.0 0.0% 0 6.04s 17,673 282 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Cobuddy 6.3 5.8 66.7% 1 17.36s 8,181 275 5,591
Grok 4.20 10.0 10.0 100.0% 0 522ms 7,749 207 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Cobuddy 2.9 4.4 22.2% 2 128.15s 540 10 49,454
Grok 4.20 3.0 10.0 0.0% 0 687ms 1,746 325 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Cobuddy 4.2 9.9 0.0% 0 23.23s 498 76 3,782
Grok 4.20 4.8 10.0 0.0% 0 659ms 819 83 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Cobuddy 9.8 10.0 100.0% 0 11.60s 508 64 2,842
Grok 4.20 6.3 10.0 50.0% 0 445ms 1,350 60 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Cobuddy 3.6 7.2 22.2% 1 12.83s 561 189 5,808
Grok 4.20 5.3 10.0 33.3% 0 473ms 1,671 198 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Cobuddy 10.0 10.0 100.0% 0 11.19s 3,505 133 294
Grok 4.20 10.0 10.0 100.0% 0 4.63s 7,245 189 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Cobuddy 3.0 10.0 0.0% 0 36.98s 153 9 6,863
Grok 4.20 0.0 0.0 0.0% 0 0ms 0 0 0

দ্রুত তুলনা

তুলনার জুটি বদলান