AI BENCHY
Advertise here

#48

Qwen3.5-Flash

Qwen প্রকাশ: 2026-02-24 পরীক্ষিত হয়েছে: 2026-05-21 23:57 qwen/qwen3.5-flash-02-23::medium
(medium) (none)

ধারাবাহিকতা

8.0

মোট খরচ (বর্তমান মূল্য)

$0.074 ↓ -25.2%

পরীক্ষার সময়: $0.099

মোট আউটপুট টোকেন

274,137

ইনপুট মূল্য

$0.065 / 1M

আউটপুট মূল্য

$0.260 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 8

প্রতি চেষ্টায় পাস রেট: 75.0%

অস্থির টেস্ট

5

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

63.04s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 234.29s

প্রতিক্রিয়া সময় (মোট): 1197.71s

রান ইতিহাস

পরীক্ষিত হয়েছে স্কোর নির্ভরযোগ্যতা সঠিক টেস্ট মোট খরচ তুলনা করুন
2026-05-21 23:57 স্যুইট পরিবর্তিত হয়েছে 7.4 8.3 $0.104 বর্তমান রান
2026-04-11 01:44 প্রথম নথিভুক্ত রান 7.8 প্রযোজ্য নয় $0.080 তুলনা করুন

এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।

রান তুলনা

রানস্কোরধারাবাহিকতানির্ভরযোগ্যতাসঠিক টেস্টঅস্থির টেস্টমোট আউটপুট টোকেনমোট খরচপ্রতিক্রিয়া সময় (গড়)
2026-05-21 23:57 · বর্তমান রান7.68.010.012/205274,137$0.09963.04s
2026-04-11 01:44 · প্রথম নথিভুক্ত রান7.87.3প্রযোজ্য নয়11/186193,972$0.08066.72s
পার্থক্য-0.2+0.7+1-1+80165+$0.020-3686ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

মূল্যের ইতিহাস

OpenRouter থেকে এই মডেলের ঐতিহাসিক মূল্য তথ্য।

তারিখ ইনপুট মূল্য আউটপুট মূল্য
2026-05-28 17:57 $0.065 / 1M $0.260 / 1M

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ স্কোর ধারাবাহিকতা সঠিক টেস্ট
অ্যান্টি-এআই কৌশল 10.0 10.0
কোডিং 4.1 5.8
সমন্বিত 10.0 10.0
ডেটা পার্সিং ও নিষ্কাশন 7.3 5.9
ডোমেইন-নির্দিষ্ট 5.3 7.2
Sadharon Buddhimotta 6.1 3.1
নির্দেশনা অনুসরণ 10.0 10.0
ধাঁধা সমাধান 8.2 7.2
টুল কলিং 10.0 10.0
সাধারণ জ্ঞান 3.0 10.0

তুলনা করা মডেল