???? ???
$1.050 / 1M
????? ???
$3.500 / 1M
অস্থির টেস্ট
4
অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।
রান ইতিহাস
| পরীক্ষিত হয়েছে | স্কোর | নির্ভরযোগ্যতা | সঠিক টেস্ট | মোট খরচ | তুলনা করুন |
|---|---|---|---|---|---|
| 2026-05-21 23:41 স্যুইট পরিবর্তিত হয়েছে | 5.6 | 10.0 | $0.057 | তুলনা করুন | |
| 2026-05-08 13:04 স্যুইট পরিবর্তিত হয়েছে | 5.7 | 10.0 | $0.053 | তুলনা করুন | |
| 2026-05-08 13:04 স্যুইট পরিবর্তিত হয়েছে | 5.7 | 10.0 | $0.053 | তুলনা করুন | |
| 2026-04-22 12:55 প্রথম নথিভুক্ত রান | 5.6 | প্রযোজ্য নয় | $0.053 | বর্তমান রান |
রান তুলনা
| রান | স্কোর | ধারাবাহিকতা | নির্ভরযোগ্যতা | সঠিক টেস্ট | অস্থির টেস্ট | মোট আউটপুট টোকেন | মোট খরচ | প্রতিক্রিয়া সময় (গড়) |
|---|---|---|---|---|---|---|---|---|
| 2026-04-22 12:55 · প্রথম নথিভুক্ত রান | 5.6 | 8.2 | প্রযোজ্য নয় | 5/18 | 4 | 3,720 | $0.053 | 4.33s |
| 2026-05-21 23:41 · স্যুইট পরিবর্তিত হয়েছে | 5.6 | 8.1 | 10.0 | 6/20 | 5 | 3,749 | $0.057 | 4.16s |
| পার্থক্য | 0.0 | +0.1 | -1 | -1 | -29 | -$0.005 | +173ms |
এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।
চার্ট
প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।
স্কোর vs মোট খরচ
প্রতিক্রিয়া সময় (গড়)
স্কোর vs প্রতিক্রিয়া সময় (গড়)
মোট আউটপুট টোকেন
স্কোর vs মোট আউটপুট টোকেন
দ্রুত তুলনা
GLM 5.1nonevsQwen3.5-FlashnoneGLM 5.1nonevsSeed-2.0-LitenoneGLM 5.1nonevsNemotron 3 Supermediumবিনামূল্যে উপলভ্যGLM 5.1nonevsOwl AlphamediumGLM 5.1nonevsDeepSeek V4 PrononeGLM 5.1nonevsQwen3.5 Plus 2026-04-20noneGLM 5.1nonevsGemini 3 Flash PreviewmediumGLM 5.1nonevsGemini 3.5 FlashhighGLM 5.1nonevsRing-2.6-1TmediumGLM 5.1nonevsGemini 3.5 Flashlow
বিভাগভিত্তিক বিশ্লেষণ
| বিভাগ | স্কোর | ধারাবাহিকতা | সঠিক টেস্ট |
|---|---|---|---|
| অ্যান্টি-এআই কৌশল | 4.0 | 6.3 | |
| কোডিং | 5.1 | 9.1 | |
| সমন্বিত | 2.8 | 2.1 | |
| ডেটা পার্সিং ও নিষ্কাশন | 10.0 | 10.0 | |
| ডোমেইন-নির্দিষ্ট | 2.9 | 7.2 | |
| Sadharon Buddhimotta | 5.0 | 10.0 | |
| নির্দেশনা অনুসরণ | 8.3 | 10.0 | |
| ধাঁধা সমাধান | 5.7 | 10.0 | |
| টুল কলিং | 10.0 | 10.0 |