নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

MoonshotAI: Kimi K2.7 Code vs OpenAI: GPT-5.3 Chat

সারাংশ

Kimi K2.7 Code vs GPT-5.3 Chat benchmark তুলনা: GPT-5.3 Chat average score-এ এগিয়ে: 7.5 vs 7.0. GPT-5.3 Chat-এর benchmark খরচ কম: $0.433 vs $0.669. GPT-5.3 Chat দ্রুত: 6.34s vs 83.60s, pass rates 66.7% vs 66.7%.

প্রস্তাবিত মডেল: GPT-5.3 Chat - It has the best score here (7.5), while costing about 1.5x less than Kimi K2.7 Code.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-12

মেট্রিক Kimi K2.7 Code Kimi K2.7 Code medium প্রকাশ: 2026-06-12 GPT-5.3 Chat GPT-5.3 Chat none প্রকাশ: 2026-03-03
স্কোর 7.0 7.5
র‍্যাঙ্ক #65 #47
নির্ভরযোগ্যতা 9.2 10.0
ধারাবাহিকতা 7.7 8.1
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 66.7% 66.7%
অস্থির টেস্ট 6 5
মোট রান 63 63
প্রতি ফলাফলে খরচ 6.074 3.605
মোট খরচ $0.669 $0.433
ইনপুট মূল্য $0.950 / 1M $1.750 / 1M
আউটপুট মূল্য $4.000 / 1M $14.000 / 1M
মোট ইনপুট টোকেন 25,991 34,209
আউটপুট টোকেন 80,516 26,617
রিজনিং টোকেন 161,391 0
প্রতিক্রিয়া সময় (গড়) 83.60s 6.34s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 365.80s 18.33s
প্রতিক্রিয়া সময় (মোট) 1671.99s 133.13s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#65 MoonshotAI: Kimi K2.7 Code

medium
Cost
$0.025
Time
138.0s
Tokens
6,093 tok

#47 GPT-5.3 Chat

none
Cost
$0.008
Time
8.1s
Tokens
634 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Kimi K2.7 Code 7.3 5.8 83.3% 2 11.56s 618 3,048 5,041
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 606 3,167 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Kimi K2.7 Code 7.6 7.2 77.8% 1 146.73s 4,650 1,864 25,635
GPT-5.3 Chat 5.6 4.7 55.6% 2 10.52s 7,302 6,632 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Kimi K2.7 Code 4.7 1.6 66.7% 1 34.83s 11,271 444 3,906
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 11,019 2,614 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Kimi K2.7 Code 10.0 10.0 100.0% 0 12.27s 7,014 248 2,569
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 7,140 942 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Kimi K2.7 Code 5.3 7.2 44.4% 1 213.29s 431 55,572 63,639
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 723 8,264 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Kimi K2.7 Code 10.0 10.0 100.0% 0 10.78s 477 1,024 1,071
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 477 319 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Kimi K2.7 Code 9.9 10.0 100.0% 0 5.39s 669 725 1,232
GPT-5.3 Chat 9.8 10.0 100.0% 0 3.51s 660 1,491 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Kimi K2.7 Code 5.9 7.7 44.4% 1 41.00s 651 15,438 17,368
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.99s 642 1,758 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Kimi K2.7 Code 3.0 10.0 0.0% 0 0ms 0 0 0
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 5,445 861 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Kimi K2.7 Code 3.0 10.0 0.0% 0 341.76s 210 2,153 40,930
GPT-5.3 Chat 3.0 10.0 0.0% 0 4.38s 195 569 0

দ্রুত তুলনা

তুলনার জুটি বদলান