#42
Qwen
প্রকাশ: 2026-04-20
পরীক্ষিত হয়েছে: 2026-05-21 23:53
qwen/qwen3.5-plus-20260420::medium
(medium)
(none)
???? ???
$0.300 / 1M
????? ???
$1.800 / 1M
অস্থির টেস্ট
3
অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।
43.63s
প্রতিক্রিয়া সময় (সর্বোচ্চ): 189.38s
প্রতিক্রিয়া সময় (মোট): 872.61s
রান ইতিহাস
| পরীক্ষিত হয়েছে | স্কোর | নির্ভরযোগ্যতা | সঠিক টেস্ট | মোট খরচ | তুলনা করুন |
|---|---|---|---|---|---|
| 2026-05-21 23:53 স্যুইট পরিবর্তিত হয়েছে | 7.6 | 9.6 | $0.363 | বর্তমান রান | |
| 2026-05-08 14:34 স্যুইট পরিবর্তিত হয়েছে | 7.8 | 9.6 | $0.305 | তুলনা করুন | |
| 2026-05-08 14:34 স্যুইট পরিবর্তিত হয়েছে | 7.8 | 9.6 | $0.305 | তুলনা করুন | |
| 2026-04-27 23:09 প্রথম রান | 8.2 | 9.7 | $0.269 | তুলনা করুন |
এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।
রান তুলনা
| রান | স্কোর | ধারাবাহিকতা | নির্ভরযোগ্যতা | সঠিক টেস্ট | অস্থির টেস্ট | মোট আউটপুট টোকেন | মোট খরচ | প্রতিক্রিয়া সময় (গড়) |
|---|---|---|---|---|---|---|---|---|
| 2026-05-21 23:53 · বর্তমান রান | 7.6 | 8.7 | 9.6 | 13/20 | 3 | 152,480 | $0.363 | 43.63s |
| 2026-04-27 23:09 · প্রথম রান | 8.2 | 9.0 | 9.7 | 13/18 | 2 | 106,011 | $0.269 | 32.81s |
| পার্থক্য | -0.6 | -0.3 | -0.1 | 0 | +1 | +46469 | +$0.095 | +10816ms |
এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।
চার্ট
প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।
স্কোর vs মোট খরচ
প্রতিক্রিয়া সময় (গড়)
স্কোর vs প্রতিক্রিয়া সময় (গড়)
মোট আউটপুট টোকেন
স্কোর vs মোট আউটপুট টোকেন
দ্রুত তুলনা
Qwen3.5 Plus 2026-04-20mediumvsQwen3.6 PlusmediumQwen3.5 Plus 2026-04-20mediumvsGemini 3.1 Flash LitemediumQwen3.5 Plus 2026-04-20mediumvsGemini 2.5 FlashmediumQwen3.5 Plus 2026-04-20mediumvsGrok 4.3mediumQwen3.5 Plus 2026-04-20mediumvsGemini 3 Flash PreviewmediumQwen3.5 Plus 2026-04-20mediumvsGemini 3.5 FlashhighQwen3.5 Plus 2026-04-20mediumvsRing-2.6-1TmediumQwen3.5 Plus 2026-04-20mediumvsGemini 3.5 Flashlow
বিভাগভিত্তিক বিশ্লেষণ
| বিভাগ | স্কোর | ধারাবাহিকতা | সঠিক টেস্ট |
|---|---|---|---|
| অ্যান্টি-এআই কৌশল | 10.0 | 10.0 | |
| কোডিং | 5.4 | 6.0 | |
| সমন্বিত | 10.0 | 10.0 | |
| ডেটা পার্সিং ও নিষ্কাশন | 10.0 | 10.0 | |
| ডোমেইন-নির্দিষ্ট | 2.9 | 7.2 | |
| Sadharon Buddhimotta | 4.9 | 9.6 | |
| নির্দেশনা অনুসরণ | 10.0 | 10.0 | |
| ধাঁধা সমাধান | 8.2 | 7.2 | |
| টুল কলিং | 10.0 | 10.0 | |
| সাধারণ জ্ঞান | 3.0 | 10.0 |