#5
Google
প্রকাশ: 2025-12-17
পরীক্ষিত হয়েছে: 2026-04-11 01:44
google/gemini-3-flash-preview::low
???? ???
$0.500 / 1M
????? ???
$3.000 / 1M
অস্থির টেস্ট
1
অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।
রান ইতিহাস
| পরীক্ষিত হয়েছে | স্কোর | নির্ভরযোগ্যতা | সঠিক টেস্ট | মোট খরচ | তুলনা করুন |
|---|---|---|---|---|---|
| 2026-05-22 00:26 স্যুইট পরিবর্তিত হয়েছে | 8.6 | 10.0 | $0.106 | তুলনা করুন | |
| 2026-04-11 01:44 প্রথম নথিভুক্ত রান | 8.8 | প্রযোজ্য নয় | $0.091 | বর্তমান রান |
রান তুলনা
| রান | স্কোর | ধারাবাহিকতা | নির্ভরযোগ্যতা | সঠিক টেস্ট | অস্থির টেস্ট | মোট আউটপুট টোকেন | মোট খরচ | প্রতিক্রিয়া সময় (গড়) |
|---|---|---|---|---|---|---|---|---|
| 2026-04-11 01:44 · প্রথম নথিভুক্ত রান | 8.8 | 9.5 | প্রযোজ্য নয় | 15/18 | 1 | 25,291 | $0.091 | 6.01s |
| 2026-05-22 00:26 · স্যুইট পরিবর্তিত হয়েছে | 8.6 | 9.6 | 10.0 | 16/20 | 1 | 29,491 | $0.106 | 5.86s |
| পার্থক্য | +0.2 | -0.1 | -1 | 0 | -4200 | -$0.015 | +145ms |
এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।
চার্ট
প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।
স্কোর vs মোট খরচ
প্রতিক্রিয়া সময় (গড়)
স্কোর vs প্রতিক্রিয়া সময় (গড়)
মোট আউটপুট টোকেন
স্কোর vs মোট আউটপুট টোকেন
দ্রুত তুলনা
Gemini 3 Flash PreviewlowvsGemini 3.5 FlashnoneGemini 3 Flash PreviewlowvsGPT-5.5lowGemini 3 Flash PreviewlowvsQwen3.6 Max PreviewmediumGemini 3 Flash PreviewlowvsGemini 3 Flash PreviewmediumGemini 3 Flash PreviewlowvsGemini 3.5 FlashhighGemini 3 Flash PreviewlowvsRing-2.6-1TmediumGemini 3 Flash PreviewlowvsGemini 3.5 Flashlow
বিভাগভিত্তিক বিশ্লেষণ
| বিভাগ | স্কোর | ধারাবাহিকতা | সঠিক টেস্ট |
|---|---|---|---|
| অ্যান্টি-এআই কৌশল | 10.0 | 10.0 | |
| কোডিং | 10.0 | 10.0 | |
| সমন্বিত | 3.0 | 10.0 | |
| ডেটা পার্সিং ও নিষ্কাশন | 10.0 | 10.0 | |
| ডোমেইন-নির্দিষ্ট | 5.3 | 7.2 | |
| Sadharon Buddhimotta | 10.0 | 10.0 | |
| নির্দেশনা অনুসরণ | 9.9 | 10.0 | |
| ধাঁধা সমাধান | 10.0 | 10.0 | |
| টুল কলিং | 10.0 | 10.0 |