#130
Arcee AI
প্রকাশ: 2026-01-27
পরীক্ষিত হয়েছে: 2026-05-08 15:30
arcee-ai/trinity-large-preview::none
4.8
ধারাবাহিকতা
8.9
10.0
$0.001
মোট আউটপুট টোকেন
2,190
মোট ইনপুট টোকেন
0
ইনপুট মূল্য
$0.150 / 1M
আউটপুট মূল্য
$0.450 / 1M
অস্থির টেস্ট
3
অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।
রান ইতিহাস
| পরীক্ষিত হয়েছে | স্কোর | নির্ভরযোগ্যতা | সঠিক টেস্ট | মোট খরচ | তুলনা করুন |
|---|---|---|---|---|---|
| 2026-05-22 00:42 স্যুইট পরিবর্তিত হয়েছে | 4.8 | 10.0 | $0.001 | তুলনা করুন | |
| 2026-05-08 15:30 স্যুইট পরিবর্তিত হয়েছে | 4.8 | 10.0 | $0.001 | বর্তমান রান | |
| 2026-04-23 10:54 প্রথম নথিভুক্ত রান | 5.3 | প্রযোজ্য নয় | $0.000 | তুলনা করুন |
এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।
রান তুলনা
| রান | স্কোর | ধারাবাহিকতা | নির্ভরযোগ্যতা | সঠিক টেস্ট | অস্থির টেস্ট | মোট আউটপুট টোকেন | মোট ইনপুট টোকেন | মোট খরচ | প্রতিক্রিয়া সময় (গড়) |
|---|---|---|---|---|---|---|---|---|---|
| 2026-05-08 15:30 · স্যুইট পরিবর্তিত হয়েছে | 4.8 | 8.9 | 10.0 | 4/19 | 3 | 2,190 | 0 | $0.001 | 3.03s |
| 2026-05-22 00:42 · স্যুইট পরিবর্তিত হয়েছে | 4.8 | 8.9 | 10.0 | 4/19 | 3 | 2,190 | 0 | $0.001 | 3.03s |
| পার্থক্য | 0.0 | 0.0 | 0.0 | -1 | 0 | 0 | 0 | $0.000 | 0ms |
এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।
চার্ট
প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।
স্কোর vs মোট খরচ
প্রতিক্রিয়া সময় (গড়)
স্কোর vs প্রতিক্রিয়া সময় (গড়)
মোট আউটপুট টোকেন
স্কোর vs মোট আউটপুট টোকেন
দ্রুত তুলনা
Trinity Large PreviewnonevsMiniMax M2.7mediumTrinity Large PreviewnonevsDeepSeek V3.2noneTrinity Large PreviewnonevsGrok 4.20noneTrinity Large PreviewnonevsQwen3.5-122B-A10BnoneTrinity Large Previewnonevsgpt-oss-120bnoneবিনামূল্যে উপলভ্যTrinity Large PreviewnonevsGLM 5 TurbononeTrinity Large PreviewnonevsGemini 3 Flash PreviewmediumTrinity Large PreviewnonevsGemini 3.5 FlashhighTrinity Large PreviewnonevsRing-2.6-1TmediumTrinity Large PreviewnonevsGemini 3.5 Flashlow
বিভাগভিত্তিক বিশ্লেষণ
| বিভাগ | স্কোর | ধারাবাহিকতা | সঠিক টেস্ট |
|---|---|---|---|
| অ্যান্টি-এআই কৌশল | 3.1 | 10.0 | |
| কোডিং | 4.9 | 3.2 | |
| সমন্বিত | 3.0 | 10.0 | |
| ডেটা পার্সিং ও নিষ্কাশন | 10.0 | 10.0 | |
| ডোমেইন-নির্দিষ্ট | 5.3 | 10.0 | |
| Sadharon Buddhimotta | 4.5 | 10.0 | |
| নির্দেশনা অনুসরণ | 3.4 | 6.2 | |
| ধাঁধা সমাধান | 3.6 | 7.7 | |
| টুল কলিং | 10.0 | 10.0 | |
| সাধারণ জ্ঞান | 3.0 | 10.0 |