Gemini 3.5 Flash

Google প্রকাশ: 2026-05-19 পরীক্ষিত হয়েছে: 2026-05-19 23:35 google/gemini-3.5-flash::medium

(high) (medium) (low) (minimal) (none)

সারাংশ

Gemini 3.5 Flash AI BENCHY-তে 9.2 স্কোর করে এবং #5 স্থানে আছে। এর reliability 10.0, pass rate 89.5%, মোট খরচ $0.393, এবং গড় response time 3.90s.

Gemini 3.5 Flash কে আলাদা করে যা: এটি সামগ্রিকভাবে সর্বোচ্চ rank করা মডেলগুলোর একটি। এই score range-এর জন্য মোট benchmark খরচ অস্বাভাবিকভাবে কম। একই ধরনের মডেলের তুলনায় এটি লক্ষণীয়ভাবে দ্রুত।

স্কোর

9.2

ধারাবাহিকতা

10.0

নির্ভরযোগ্যতা

10.0

মোট খরচ (বর্তমান মূল্য)

$0.393

মোট আউটপুট টোকেন

38,630

মোট ইনপুট টোকেন

ইনপুট মূল্য

$1.500 / 1M

আউটপুট মূল্য

$9.000 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 2

প্রতি চেষ্টায় পাস রেট: 89.5%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

3.90s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 12.05s

প্রতিক্রিয়া সময় (মোট): 74.13s

ভুল উত্তর: 2

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#5 Gemini 3.5 Flash

medium

খরচ: $0.201
সময়: 112.9s
টোকেন: 22,371 tok

রান ইতিহাস

পরীক্ষিত হয়েছে	স্কোর	নির্ভরযোগ্যতা	মোট খরচ	তুলনা করুন
2026-06-04 14:03 নতুন টেস্ট যোগ হয়েছে	9.0	10.0	$0.582	তুলনা করুন
2026-05-22 00:29 পুনরায় পরীক্ষা	9.0	10.0	$0.472	তুলনা করুন
2026-05-19 23:35 প্রথম রান	9.2	10.0	$0.393	বর্তমান রান

রান তুলনা

রান	স্কোর	ধারাবাহিকতা	নির্ভরযোগ্যতা	সঠিক টেস্ট	অস্থির টেস্ট	মোট আউটপুট টোকেন	মোট খরচ	প্রতিক্রিয়া সময় (গড়)
2026-05-19 23:35 · প্রথম রান	9.2	10.0	10.0	17/19	0	38,630	$0.393	3.90s
2026-05-22 00:29 · পুনরায় পরীক্ষা	9.0	9.6	10.0	17/20	1	46,787	$0.472	4.29s
পার্থক্য	+0.3	+0.4	0.0	0	-1	-8157	-$0.080	-385ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	10.0	10.0
কোডিং	10.0	10.0
সমন্বিত	10.0	10.0
ডেটা পার্সিং ও নিষ্কাশন	10.0	10.0
ডোমেইন-নির্দিষ্ট	7.7	10.0
Sadharon Buddhimotta	10.0	10.0
নির্দেশনা অনুসরণ	9.9	10.0
ধাঁধা সমাধান	7.7	10.0
টুল কলিং	10.0	10.0
সাধারণ জ্ঞান	10.0	10.0

Gemini 3.5 Flash

Hamster playing table tennis

#5 Gemini 3.5 Flash

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল