#67
Google
প্রকাশ: 2025-06-17
পরীক্ষিত হয়েছে: 2026-04-11 01:44
google/gemini-2.5-flash::none
(medium)
(none)
6.2
ধারাবাহিকতা
9.2
প্রযোজ্য নয়
$0.013
মোট আউটপুট টোকেন
1,726
ইনপুট মূল্য
$0.300 / 1M
আউটপুট মূল্য
$2.500 / 1M
অস্থির টেস্ট
2
অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।
রান ইতিহাস
| পরীক্ষিত হয়েছে | স্কোর | নির্ভরযোগ্যতা | সঠিক টেস্ট | মোট খরচ | তুলনা করুন |
|---|---|---|---|---|---|
| 2026-05-22 00:28 স্যুইট পরিবর্তিত হয়েছে | 6.2 | 10.0 | $0.015 | তুলনা করুন | |
| 2026-04-11 01:44 প্রথম নথিভুক্ত রান | 6.2 | প্রযোজ্য নয় | $0.013 | বর্তমান রান |
রান তুলনা
| রান | স্কোর | ধারাবাহিকতা | নির্ভরযোগ্যতা | সঠিক টেস্ট | অস্থির টেস্ট | মোট আউটপুট টোকেন | মোট খরচ | প্রতিক্রিয়া সময় (গড়) |
|---|---|---|---|---|---|---|---|---|
| 2026-04-11 01:44 · প্রথম নথিভুক্ত রান | 6.2 | 9.2 | প্রযোজ্য নয় | 7/18 | 2 | 1,726 | $0.013 | 903ms |
| 2026-05-22 00:28 · স্যুইট পরিবর্তিত হয়েছে | 6.2 | 9.2 | 10.0 | 8/20 | 2 | 1,762 | $0.015 | 893ms |
| পার্থক্য | 0.0 | 0.0 | -1 | 0 | -36 | -$0.002 | +10ms |
এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।
চার্ট
প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।
স্কোর vs মোট খরচ
প্রতিক্রিয়া সময় (গড়)
স্কোর vs প্রতিক্রিয়া সময় (গড়)
মোট আউটপুট টোকেন
স্কোর vs মোট আউটপুট টোকেন
দ্রুত তুলনা
Gemini 2.5 FlashnonevsGrok 4.20mediumGemini 2.5 FlashnonevsDeepSeek V3.2mediumGemini 2.5 FlashnonevsClaude Sonnet 4.6noneGemini 2.5 FlashnonevsSeed-2.0-MinimediumGemini 2.5 FlashnonevsGemma 4 31Bnoneবিনামূল্যে উপলভ্যGemini 2.5 FlashnonevsGemini 3 Flash PreviewmediumGemini 2.5 FlashnonevsGemini 3.5 FlashhighGemini 2.5 FlashnonevsRing-2.6-1TmediumGemini 2.5 FlashnonevsGemini 3.5 Flashlow
বিভাগভিত্তিক বিশ্লেষণ
| বিভাগ | স্কোর | ধারাবাহিকতা | সঠিক টেস্ট |
|---|---|---|---|
| অ্যান্টি-এআই কৌশল | 3.0 | 10.0 | |
| কোডিং | 10.0 | 10.0 | |
| সমন্বিত | 3.0 | 10.0 | |
| ডেটা পার্সিং ও নিষ্কাশন | 10.0 | 10.0 | |
| ডোমেইন-নির্দিষ্ট | 5.9 | 7.2 | |
| Sadharon Buddhimotta | 5.0 | 10.0 | |
| নির্দেশনা অনুসরণ | 8.0 | 6.8 | |
| ধাঁধা সমাধান | 5.7 | 10.0 | |
| টুল কলিং | 10.0 | 10.0 |