AI BENCHY
Advertise here

#40

Gemini 2.5 Flash

Google প্রকাশ: 2025-06-17 পরীক্ষিত হয়েছে: 2026-05-22 00:32 google/gemini-2.5-flash::medium
(medium) (none)

ধারাবাহিকতা

9.6

মোট আউটপুট টোকেন

139,179

ইনপুট মূল্য

$0.300 / 1M

আউটপুট মূল্য

$2.500 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 7

প্রতি চেষ্টায় পাস রেট: 68.3%

অস্থির টেস্ট

1

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

15.57s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 95.48s

প্রতিক্রিয়া সময় (মোট): 311.47s

রান ইতিহাস

পরীক্ষিত হয়েছে স্কোর নির্ভরযোগ্যতা সঠিক টেস্ট মোট খরচ তুলনা করুন
2026-05-22 00:32 স্যুইট পরিবর্তিত হয়েছে 7.7 10.0 $0.358 বর্তমান রান
2026-04-11 01:44 প্রথম নথিভুক্ত রান 8.2 প্রযোজ্য নয় $0.319 তুলনা করুন

এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।

রান তুলনা

রানস্কোরধারাবাহিকতানির্ভরযোগ্যতাসঠিক টেস্টঅস্থির টেস্টমোট আউটপুট টোকেনমোট খরচপ্রতিক্রিয়া সময় (গড়)
2026-05-22 00:32 · বর্তমান রান7.79.610.013/201139,179$0.35815.57s
2026-04-11 01:44 · প্রথম নথিভুক্ত রান8.29.5প্রযোজ্য নয়13/181124,171$0.31912.12s
পার্থক্য-0.5+0.100+15008+$0.039+3456ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

মূল্যের ইতিহাস

OpenRouter থেকে এই মডেলের ঐতিহাসিক মূল্য তথ্য।

তারিখ ইনপুট মূল্য আউটপুট মূল্য
2026-06-01 11:25 $0.300 / 1M $2.500 / 1M

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ স্কোর ধারাবাহিকতা সঠিক টেস্ট
অ্যান্টি-এআই কৌশল 8.4 10.0
কোডিং 6.6 10.0
সমন্বিত 10.0 10.0
ডেটা পার্সিং ও নিষ্কাশন 10.0 10.0
ডোমেইন-নির্দিষ্ট 5.9 7.2
Sadharon Buddhimotta 4.8 10.0
নির্দেশনা অনুসরণ 9.8 10.0
ধাঁধা সমাধান 7.7 10.0
টুল কলিং 10.0 10.0
সাধারণ জ্ঞান 3.0 10.0

তুলনা করা মডেল