AI BENCHY Compare
Arcee AI: Trinity Large Preview (free) vs MoonshotAI: Kimi K2.5
AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-03
| মেট্রিক | Arcee AI: Trinity Large Preview (free) none প্রকাশ: 2026-01-27 বিনামূল্যে উপলভ্য | MoonshotAI: Kimi K2.5 none প্রকাশ: 2026-01-27 |
|---|---|---|
| র্যাঙ্ক | #33 | #35 |
| গড় স্কোর | 4.34 | 4.07 |
| ধারাবাহিকতা | 9.97 | 8.92 |
| প্রতি ফলাফলে খরচ | 0.000 | 0.232 |
| মোট খরচ | $0.000 | $0.010 |
| সঠিক টেস্ট | 5/14 | 4/14 |
| প্রতি চেষ্টায় পাস রেট | 35.7% | 35.7% |
| অস্থির টেস্ট | 0 | 2 |
| আউটপুট টোকেন | 1,415 | 1,915 |
| রিজনিং টোকেন | 0 | 0 |
বিভাগভিত্তিক বিশ্লেষণ
| অ্যান্টি-এআই কৌশল | স্কোর | ধারাবাহিকতা | প্রতি চেষ্টায় পাস রেট | অস্থির টেস্ট | সঠিক টেস্ট | আউটপুট টোকেন | রিজনিং টোকেন |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 1.00 | 10.00 | 0.0% | 0 | 587 | 0 | |
| MoonshotAI: Kimi K2.5 | 2.67 | 7.86 | 11.1% | 1 | 363 | 0 |
| ডেটা পার্সিং ও নিষ্কাশন | স্কোর | ধারাবাহিকতা | প্রতি চেষ্টায় পাস রেট | অস্থির টেস্ট | সঠিক টেস্ট | আউটপুট টোকেন | রিজনিং টোকেন |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 9.88 | 10.00 | 100.0% | 0 | 186 | 0 | |
| MoonshotAI: Kimi K2.5 | 5.50 | 5.81 | 83.3% | 1 | 995 | 0 |
| ডোমেইন-নির্দিষ্ট | স্কোর | ধারাবাহিকতা | প্রতি চেষ্টায় পাস রেট | অস্থির টেস্ট | সঠিক টেস্ট | আউটপুট টোকেন | রিজনিং টোকেন |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 4.00 | 10.00 | 33.3% | 0 | 21 | 0 | |
| MoonshotAI: Kimi K2.5 | 4.00 | 10.00 | 33.3% | 0 | 29 | 0 |
| নির্দেশনা অনুসরণ | স্কোর | ধারাবাহিকতা | প্রতি চেষ্টায় পাস রেট | অস্থির টেস্ট | সঠিক টেস্ট | আউটপুট টোকেন | রিজনিং টোকেন |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 2.00 | 9.79 | 0.0% | 0 | 63 | 0 | |
| MoonshotAI: Kimi K2.5 | 5.00 | 9.99 | 50.0% | 0 | 61 | 0 |
| Puzzle Solving | স্কোর | ধারাবাহিকতা | প্রতি চেষ্টায় পাস রেট | অস্থির টেস্ট | সঠিক টেস্ট | আউটপুট টোকেন | রিজনিং টোকেন |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 4.00 | 9.99 | 33.3% | 0 | 291 | 0 | |
| MoonshotAI: Kimi K2.5 | 2.00 | 9.92 | 0.0% | 0 | 247 | 0 |
| টুল কলিং | স্কোর | ধারাবাহিকতা | প্রতি চেষ্টায় পাস রেট | অস্থির টেস্ট | সঠিক টেস্ট | আউটপুট টোকেন | রিজনিং টোকেন |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 10.00 | 10.00 | 100.0% | 0 | 267 | 0 | |
| MoonshotAI: Kimi K2.5 | 10.00 | 10.00 | 100.0% | 0 | 220 | 0 |
দ্রুত তুলনা
তুলনার জুটি বদলান
Kimi K2.5nonevsGLM 4.7 FlashmediumTrinity Large Preview (free)noneবিনামূল্যে উপলভ্যvsGLM 4.7 FlashmediumKimi K2.5nonevsQwen3 Coder NextmediumTrinity Large Preview (free)noneবিনামূল্যে উপলভ্যvsQwen3 Coder NextmediumTrinity Large Preview (free)noneবিনামূল্যে উপলভ্যvsMiniMax M2.5mediumTrinity Large Preview (free)noneবিনামূল্যে উপলভ্যvsgpt-oss-120bmediumবিনামূল্যে উপলভ্যTrinity Large Preview (free)noneবিনামূল্যে উপলভ্যvsQwen3.5-FlashmediumTrinity Large Preview (free)noneবিনামূল্যে উপলভ্যvsGPT-5 NanomediumMiniMax M2.5mediumvsKimi K2.5noneKimi K2.5nonevsgpt-oss-120bmediumবিনামূল্যে উপলভ্যTrinity Large Preview (free)noneবিনামূল্যে উপলভ্যvsQwen3.5-35B-A3BmediumTrinity Large Preview (free)noneবিনামূল্যে উপলভ্যvsMiMo-V2-Flashmedium