#78
Qwen
প্রকাশ: 2026-04-20
পরীক্ষিত হয়েছে: 2026-04-27 21:31
qwen/qwen3.6-27b::none
(medium)
(none)
???? ???
$0.500 / 1M
????? ???
$2.000 / 1M
অস্থির টেস্ট
4
অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।
রান ইতিহাস
| পরীক্ষিত হয়েছে | স্কোর | নির্ভরযোগ্যতা | সঠিক টেস্ট | মোট খরচ | তুলনা করুন |
|---|---|---|---|---|---|
| 2026-04-27 21:46 নতুন টেস্ট যোগ হয়েছে | 6.0 | 10.0 | $0.031 | তুলনা করুন | |
| 2026-04-27 21:31 প্রথম নথিভুক্ত রান | 5.9 | 10.0 | $0.027 | বর্তমান রান |
রান তুলনা
| রান | স্কোর | ধারাবাহিকতা | নির্ভরযোগ্যতা | সঠিক টেস্ট | অস্থির টেস্ট | মোট আউটপুট টোকেন | মোট খরচ | প্রতিক্রিয়া সময় (গড়) |
|---|---|---|---|---|---|---|---|---|
| 2026-04-27 21:31 · প্রথম নথিভুক্ত রান | 5.9 | 6.9 | 10.0 | 4/11 | 4 | 2,924 | $0.027 | 4.19s |
| 2026-04-27 21:46 · নতুন টেস্ট যোগ হয়েছে | 6.0 | 7.2 | 10.0 | 7/18 | 6 | 3,775 | $0.031 | 4.00s |
| পার্থক্য | -0.1 | -0.3 | 0.0 | -3 | -2 | -851 | -$0.004 | +186ms |
এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।
চার্ট
প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।
স্কোর vs মোট খরচ
প্রতিক্রিয়া সময় (গড়)
স্কোর vs প্রতিক্রিয়া সময় (গড়)
মোট আউটপুট টোকেন
স্কোর vs মোট আউটপুট টোকেন
দ্রুত তুলনা
Qwen3.6 27BnonevsQwen3.5-FlashnoneQwen3.6 27BnonevsSeed-2.0-LitenoneQwen3.6 27BnonevsGLM 5V TurbononeQwen3.6 27BnonevsGemini 2.5 FlashnoneQwen3.6 27BnonevsGPT-5 NanomediumQwen3.6 27BnonevsQwen3.5-35B-A3BnoneQwen3.6 27BnonevsGemini 3 Flash PreviewmediumQwen3.6 27BnonevsGemini 3.1 Pro PreviewmediumQwen3.6 27BnonevsHY3 Previewhighবিনামূল্যে উপলভ্য
বিভাগভিত্তিক বিশ্লেষণ
| বিভাগ | স্কোর | ধারাবাহিকতা | সঠিক টেস্ট |
|---|---|---|---|
| অ্যান্টি-এআই কৌশল | 4.0 | 1.6 | |
| কোডিং | 10.0 | 10.0 | |
| সমন্বিত | 3.0 | 10.0 | |
| ডেটা পার্সিং ও নিষ্কাশন | 9.9 | 10.0 | |
| ডোমেইন-নির্দিষ্ট | 6.5 | 10.0 | |
| Sadharon Buddhimotta | 5.2 | 9.9 | |
| নির্দেশনা অনুসরণ | 2.8 | 1.6 | |
| টুল কলিং | 9.5 | 10.0 |