AI BENCHY
Advertise here
#2

Gemini 3.1 Pro Preview

Google প্রকাশ: 2026-02-19 পরীক্ষিত হয়েছে: 2026-04-11 01:44 google/gemini-3.1-pro-preview::medium

সারাংশ

Gemini 3.1 Pro Preview AI BENCHY-তে 9.6 স্কোর করে এবং #2 স্থানে আছে। এর reliability প্রযোজ্য নয়, pass rate 94.4%, মোট খরচ $0.578, এবং গড় response time 15.96s.

Gemini 3.1 Pro Preview কে আলাদা করে যা: এটি সামগ্রিকভাবে সর্বোচ্চ rank করা মডেলগুলোর একটি। এই score range-এর জন্য মোট benchmark খরচ অস্বাভাবিকভাবে কম।

ধারাবাহিকতা

10.0

নির্ভরযোগ্যতা

প্রযোজ্য নয়

মোট আউটপুট টোকেন

42,474

মোট ইনপুট টোকেন

0

ইনপুট মূল্য

$2.000 / 1M

আউটপুট মূল্য

$12.000 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 1

প্রতি চেষ্টায় পাস রেট: 94.4%

অস্থির টেস্ট

0

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

15.96s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 40.61s

প্রতিক্রিয়া সময় (মোট): 175.52s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#2 Gemini 3.1 Pro Preview

medium
খরচ
$0.115
সময়
87.2s
টোকেন
9,629 tok

রান ইতিহাস

পরীক্ষিত হয়েছে স্কোর নির্ভরযোগ্যতা সঠিক টেস্ট মোট খরচ তুলনা করুন
2026-06-04 14:04 নতুন টেস্ট যোগ হয়েছে 9.4 10.0 $1.054 তুলনা করুন
2026-05-22 00:30 স্যুইট পরিবর্তিত হয়েছে 9.3 10.0 $1.006 তুলনা করুন
2026-04-11 01:44 প্রথম নথিভুক্ত রান 9.6 প্রযোজ্য নয় $0.578 বর্তমান রান

রান তুলনা

রানস্কোরধারাবাহিকতানির্ভরযোগ্যতাসঠিক টেস্টঅস্থির টেস্টমোট আউটপুট টোকেনমোট ইনপুট টোকেনমোট খরচপ্রতিক্রিয়া সময় (গড়)
2026-04-11 01:44 · প্রথম নথিভুক্ত রান9.610.0প্রযোজ্য নয়17/18042,4740$0.57815.96s
2026-05-22 00:30 · স্যুইট পরিবর্তিত হয়েছে9.310.010.018/20077,3410$1.00620.80s
পার্থক্য+0.30.0-10-348670-$0.428-4849ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ স্কোর ধারাবাহিকতা সঠিক টেস্ট
অ্যান্টি-এআই কৌশল 10.0 10.0
কোডিং 10.0 10.0
সমন্বিত 9.5 10.0
ডেটা পার্সিং ও নিষ্কাশন 10.0 10.0
ডোমেইন-নির্দিষ্ট 7.7 10.0
Sadharon Buddhimotta 10.0 10.0
নির্দেশনা অনুসরণ 10.0 10.0
ধাঁধা সমাধান 10.0 10.0
টুল কলিং 10.0 10.0

তুলনা করা মডেল