নেভিগেশন
AI BENCHY
তুলনা করুন চার্ট Poddhoti
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Trinity Large Preview vs MoonshotAI: Kimi K2.5

তুলনা করুন:

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-06

মেট্রিক Trinity Large Preview none প্রকাশ: 2026-01-27 বিনামূল্যে উপলভ্য MoonshotAI: Kimi K2.5 none প্রকাশ: 2026-01-27
র‍্যাঙ্ক #45 #46
গড় স্কোর 4.2 4.1
ধারাবাহিকতা 9.6 8.6
প্রতি ফলাফলে খরচ 0.000 0.295
মোট খরচ $0.000 $0.015
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 33.3% 39.6%
অস্থির টেস্ট 1 3
মোট রান 48 (16 x 3) 48 (16 x 3)
আউটপুট টোকেন 1,837 2,000
রিজনিং টোকেন 0 0
প্রতিক্রিয়া সময় (গড়) 3.15s 11.91s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 8.91s 42.13s
প্রতিক্রিয়া সময় (মোট) 50.46s 107.16s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

গড় স্কোর vs প্রতিক্রিয়া সময় (গড়)

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Trinity Large Preview 10.0 10.0 0.0% 0 3.59s 587 0
MoonshotAI: Kimi K2.5 2.7 7.9 11.1% 1 11.38s 363 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Trinity Large Preview 10.0 10.0 0.0% 0 8.91s 294 0
MoonshotAI: Kimi K2.5 10.0 2.1 33.3% 1 19.16s 748 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Trinity Large Preview 9.9 10.0 100.0% 0 3.26s 186 0
MoonshotAI: Kimi K2.5 5.4 5.8 83.3% 1 42.13s 187 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Trinity Large Preview 4.0 10.0 33.3% 0 877ms 25 0
MoonshotAI: Kimi K2.5 4.0 10.0 33.3% 0 4.38s 29 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Trinity Large Preview 3.0 9.9 0.0% 0 2.86s 124 0
MoonshotAI: Kimi K2.5 10.0 10.0 100.0% 0 4.00s 76 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Trinity Large Preview 3.5 6.7 16.7% 1 1.09s 63 0
MoonshotAI: Kimi K2.5 5.5 10.0 50.0% 0 2.67s 60 0
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Trinity Large Preview 4.0 10.0 33.3% 0 3.30s 291 0
MoonshotAI: Kimi K2.5 10.0 10.0 0.0% 0 4.73s 317 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 267 0
MoonshotAI: Kimi K2.5 10.0 10.0 100.0% 0 13.99s 220 0

দ্রুত তুলনা

তুলনার জুটি বদলান