#37
Qwen
প্রকাশ: 2026-04-20
পরীক্ষিত হয়েছে: 2026-04-27 21:31
qwen/qwen3.6-27b::medium
(medium)
(none)
???? ???
$0.500 / 1M
????? ???
$2.000 / 1M
অস্থির টেস্ট
1
অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।
25.56s
প্রতিক্রিয়া সময় (সর্বোচ্চ): 47.48s
প্রতিক্রিয়া সময় (মোট): 153.33s
রান ইতিহাস
| পরীক্ষিত হয়েছে | স্কোর | নির্ভরযোগ্যতা | সঠিক টেস্ট | মোট খরচ | তুলনা করুন |
|---|---|---|---|---|---|
| 2026-04-27 21:48 নতুন টেস্ট যোগ হয়েছে | 7.0 | 10.0 | $0.209 | তুলনা করুন | |
| 2026-04-27 21:31 প্রথম নথিভুক্ত রান | 7.9 | 10.0 | $0.043 | বর্তমান রান |
রান তুলনা
| রান | স্কোর | ধারাবাহিকতা | নির্ভরযোগ্যতা | সঠিক টেস্ট | অস্থির টেস্ট | মোট আউটপুট টোকেন | মোট খরচ | প্রতিক্রিয়া সময় (গড়) |
|---|---|---|---|---|---|---|---|---|
| 2026-04-27 21:31 · প্রথম নথিভুক্ত রান | 7.9 | 8.5 | 10.0 | 4/6 | 1 | 21,553 | $0.043 | 25.56s |
| 2026-04-27 21:48 · নতুন টেস্ট যোগ হয়েছে | 7.0 | 7.9 | 10.0 | 9/18 | 5 | 99,362 | $0.209 | 50.53s |
| পার্থক্য | +0.9 | +0.6 | 0.0 | -5 | -4 | -77809 | -$0.166 | -24972ms |
এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।
চার্ট
প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।
স্কোর vs মোট খরচ
প্রতিক্রিয়া সময় (গড়)
স্কোর vs প্রতিক্রিয়া সময় (গড়)
মোট আউটপুট টোকেন
স্কোর vs মোট আউটপুট টোকেন
দ্রুত তুলনা
Qwen3.6 27BmediumvsGPT-5.4 MinimediumQwen3.6 27BmediumvsKimi K2.5mediumQwen3.6 27BmediumvsQwen3.6 Max PreviewnoneQwen3.6 27BmediumvsQwen3.5-35B-A3BmediumQwen3.6 27BmediumvsGrok 4.20mediumQwen3.6 27BmediumvsGemini 3 Flash PreviewmediumQwen3.6 27BmediumvsGemini 3.1 Pro PreviewmediumQwen3.6 27BmediumvsHY3 Previewhighবিনামূল্যে উপলভ্য
বিভাগভিত্তিক বিশ্লেষণ
| বিভাগ | স্কোর | ধারাবাহিকতা | সঠিক টেস্ট |
|---|---|---|---|
| অ্যান্টি-এআই কৌশল | 10.0 | 10.0 | |
| ডেটা পার্সিং ও নিষ্কাশন | 4.3 | 1.2 | |
| ডোমেইন-নির্দিষ্ট | 3.0 | 10.0 | |
| নির্দেশনা অনুসরণ | 10.0 | 10.0 | |
| টুল কলিং | 10.0 | 10.0 |