#68
Qwen
প্রকাশ: 2026-02-24
পরীক্ষিত হয়েছে: 2026-04-11 01:19
qwen/qwen3.5-35b-a3b::none
(medium)
(none)
6.1
ধারাবাহিকতা
8.7
প্রযোজ্য নয়
$0.016
মোট আউটপুট টোকেন
4,300
ইনপুট মূল্য
$0.163 / 1M
আউটপুট মূল্য
$1.300 / 1M
অস্থির টেস্ট
3
অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।
রান ইতিহাস
| পরীক্ষিত হয়েছে | স্কোর | নির্ভরযোগ্যতা | সঠিক টেস্ট | মোট খরচ | তুলনা করুন |
|---|---|---|---|---|---|
| 2026-05-22 00:00 স্যুইট পরিবর্তিত হয়েছে | 5.8 | 10.0 | $0.016 | তুলনা করুন | |
| 2026-04-11 01:19 প্রথম নথিভুক্ত রান | 6.1 | প্রযোজ্য নয় | $0.016 | বর্তমান রান |
রান তুলনা
| রান | স্কোর | ধারাবাহিকতা | নির্ভরযোগ্যতা | সঠিক টেস্ট | অস্থির টেস্ট | মোট আউটপুট টোকেন | মোট খরচ | প্রতিক্রিয়া সময় (গড়) |
|---|---|---|---|---|---|---|---|---|
| 2026-04-11 01:19 · প্রথম নথিভুক্ত রান | 6.1 | 8.7 | প্রযোজ্য নয় | 7/18 | 3 | 4,300 | $0.016 | 3.82s |
| 2026-05-22 00:00 · স্যুইট পরিবর্তিত হয়েছে | 5.8 | 8.9 | 10.0 | 7/20 | 3 | 4,334 | $0.016 | 3.50s |
| পার্থক্য | +0.3 | -0.2 | 0 | 0 | -34 | -$0.001 | +319ms |
এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।
চার্ট
প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।
স্কোর vs মোট খরচ
প্রতিক্রিয়া সময় (গড়)
স্কোর vs প্রতিক্রিয়া সময় (গড়)
মোট আউটপুট টোকেন
স্কোর vs মোট আউটপুট টোকেন
দ্রুত তুলনা
Qwen3.5-35B-A3BnonevsGemini 2.5 FlashnoneQwen3.5-35B-A3BnonevsMercury 2mediumQwen3.5-35B-A3BnonevsGLM 5noneQwen3.5-35B-A3BnonevsGPT-5.5noneQwen3.5-35B-A3BnonevsGemma 4 26B A4Bnoneবিনামূল্যে উপলভ্যQwen3.5-35B-A3BnonevsGemini 3 Flash PreviewmediumQwen3.5-35B-A3BnonevsGemini 3.5 FlashhighQwen3.5-35B-A3BnonevsRing-2.6-1TmediumQwen3.5-35B-A3BnonevsGemini 3.5 Flashlow
বিভাগভিত্তিক বিশ্লেষণ
| বিভাগ | স্কোর | ধারাবাহিকতা | সঠিক টেস্ট |
|---|---|---|---|
| অ্যান্টি-এআই কৌশল | 3.4 | 7.9 | |
| কোডিং | 10.0 | 10.0 | |
| সমন্বিত | 3.0 | 10.0 | |
| ডেটা পার্সিং ও নিষ্কাশন | 10.0 | 10.0 | |
| ডোমেইন-নির্দিষ্ট | 7.7 | 10.0 | |
| Sadharon Buddhimotta | 6.5 | 3.4 | |
| নির্দেশনা অনুসরণ | 6.3 | 10.0 | |
| ধাঁধা সমাধান | 3.9 | 7.4 | |
| টুল কলিং | 10.0 | 10.0 |