সারাংশ
Ling-2.6-flash AI BENCHY-তে 5.3 স্কোর করে এবং #128 স্থানে আছে। এর reliability 10.0, pass rate 35.1%, মোট খরচ $0.001, এবং গড় response time 9.76s.
Ling-2.6-flash কে আলাদা করে যা: এটি কোডিং-তে সবচেয়ে ভালোভাবে নজর কাড়ে, যেখানে এর rank #1; আর ধাঁধা সমাধান এর দুর্বলতম ক্ষেত্র, rank #15. এই score range-এর জন্য মোট benchmark খরচ অস্বাভাবিকভাবে কম।
5.3
ধারাবাহিকতা
9.2
10.0
$0.001
মোট আউটপুট টোকেন
2,878
মোট ইনপুট টোকেন
0
ইনপুট মূল্য
$0.010 / 1M
আউটপুট মূল্য
$0.030 / 1M
অস্থির টেস্ট
2
অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।
রান ইতিহাস
| পরীক্ষিত হয়েছে | স্কোর | নির্ভরযোগ্যতা | সঠিক টেস্ট | মোট খরচ | তুলনা করুন |
|---|---|---|---|---|---|
| 2026-06-04 14:30 নতুন টেস্ট যোগ হয়েছে | 5.0 | 10.0 | $0.001 ↑ | তুলনা করুন | |
| 2026-05-22 00:42 স্যুইট পরিবর্তিত হয়েছে | 5.3 | 10.0 | $0.001 | বর্তমান রান | |
| 2026-05-08 15:30 স্যুইট পরিবর্তিত হয়েছে | 5.3 | 10.0 | $0.001 | তুলনা করুন | |
| 2026-04-22 12:55 প্রথম নথিভুক্ত রান | 5.4 | প্রযোজ্য নয় | $0.000 | তুলনা করুন |
এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।
চার্ট
প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।
স্কোর vs মোট খরচ
প্রতিক্রিয়া সময় (গড়)
স্কোর vs প্রতিক্রিয়া সময় (গড়)
মোট আউটপুট টোকেন
স্কোর vs মোট আউটপুট টোকেন
দ্রুত তুলনা
বিভাগভিত্তিক বিশ্লেষণ
| বিভাগ | স্কোর | ধারাবাহিকতা | সঠিক টেস্ট |
|---|---|---|---|
| অ্যান্টি-এআই কৌশল | 6.8 | 8.1 | |
| কোডিং | 10.0 | 10.0 | |
| সমন্বিত | 3.0 | 10.0 | |
| ডেটা পার্সিং ও নিষ্কাশন | 6.5 | 10.0 | |
| ডোমেইন-নির্দিষ্ট | 3.0 | 10.0 | |
| Sadharon Buddhimotta | 4.0 | 10.0 | |
| নির্দেশনা অনুসরণ | 9.8 | 10.0 | |
| ধাঁধা সমাধান | 2.9 | 7.2 | |
| টুল কলিং | 3.0 | 10.0 | |
| সাধারণ জ্ঞান | 3.0 | 10.0 |