AI BENCHY
Advertise here

#100

Qwen3.5-Flash

Qwen প্রকাশ: 2026-02-24 পরীক্ষিত হয়েছে: 2026-05-21 23:55 qwen/qwen3.5-flash-02-23::none
(medium) (none)

ধারাবাহিকতা

9.7

মোট খরচ (বর্তমান মূল্য)

$0.004 ↓ -32.1%

পরীক্ষার সময়: $0.006

মোট আউটপুট টোকেন

4,270

ইনপুট মূল্য

$0.065 / 1M

আউটপুট মূল্য

$0.260 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 12

প্রতি চেষ্টায় পাস রেট: 41.7%

অস্থির টেস্ট

1

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

3.74s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 27.18s

প্রতিক্রিয়া সময় (মোট): 74.71s

রান ইতিহাস

পরীক্ষিত হয়েছে স্কোর নির্ভরযোগ্যতা সঠিক টেস্ট মোট খরচ তুলনা করুন
2026-05-21 23:55 স্যুইট পরিবর্তিত হয়েছে 5.9 10.0 $0.006 বর্তমান রান
2026-04-11 01:19 প্রথম নথিভুক্ত রান 6.2 প্রযোজ্য নয় $0.006 তুলনা করুন

এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।

রান তুলনা

রানস্কোরধারাবাহিকতানির্ভরযোগ্যতাসঠিক টেস্টঅস্থির টেস্টমোট আউটপুট টোকেনমোট খরচপ্রতিক্রিয়া সময় (গড়)
2026-05-21 23:55 · বর্তমান রান5.99.710.08/2014,270$0.0063.74s
2026-04-11 01:19 · প্রথম নথিভুক্ত রান6.29.6প্রযোজ্য নয়8/1814,266$0.0063.25s
পার্থক্য-0.3+0.100+4+$0.001+489ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

মূল্যের ইতিহাস

OpenRouter থেকে এই মডেলের ঐতিহাসিক মূল্য তথ্য।

তারিখ ইনপুট মূল্য আউটপুট মূল্য
2026-05-28 17:57 $0.065 / 1M $0.260 / 1M

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ স্কোর ধারাবাহিকতা সঠিক টেস্ট
অ্যান্টি-এআই কৌশল 3.5 8.3
কোডিং 6.8 10.0
সমন্বিত 3.0 10.0
ডেটা পার্সিং ও নিষ্কাশন 10.0 10.0
ডোমেইন-নির্দিষ্ট 7.7 10.0
Sadharon Buddhimotta 10.0 10.0
নির্দেশনা অনুসরণ 6.3 10.0
ধাঁধা সমাধান 3.1 10.0
টুল কলিং 10.0 10.0
সাধারণ জ্ঞান 3.0 10.0

তুলনা করা মডেল