Gemini 3 Flash Preview

Google প্রকাশ: 2025-12-17 পরীক্ষিত হয়েছে: 2026-05-06 13:38 google/gemini-3-flash-preview::medium

(medium) (low) (none)

সারাংশ

Gemini 3 Flash Preview AI BENCHY-তে 9.8 স্কোর করে এবং #1 স্থানে আছে। এর reliability 10.0, pass rate 98.2%, মোট খরচ $0.320, এবং গড় response time 11.53s.

Gemini 3 Flash Preview কে আলাদা করে যা: এটি ডোমেইন-নির্দিষ্ট-তে সবচেয়ে ভালোভাবে নজর কাড়ে, যেখানে এর rank #1; আর ধাঁধা সমাধান এর দুর্বলতম ক্ষেত্র, rank #8. এটি সামগ্রিকভাবে সর্বোচ্চ rank করা মডেলগুলোর একটি। এই score range-এর জন্য মোট benchmark খরচ অস্বাভাবিকভাবে কম।

স্কোর

9.8

ধারাবাহিকতা

9.6

নির্ভরযোগ্যতা

10.0

মোট খরচ (বর্তমান মূল্য)

$0.320

মোট আউটপুট টোকেন

101,480

মোট ইনপুট টোকেন

ইনপুট মূল্য

$0.500 / 1M

আউটপুট মূল্য

$3.000 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 1

প্রতি চেষ্টায় পাস রেট: 98.2%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

11.53s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 74.66s

প্রতিক্রিয়া সময় (মোট): 207.46s

নির্দেশনা অনুসরণ করা হয়নি: 1

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#1 Gemini 3 Flash Preview

medium

খরচ: $0.010
সময়: 17.9s
টোকেন: 3,236 tok

রান ইতিহাস

পরীক্ষিত হয়েছে	স্কোর	নির্ভরযোগ্যতা	মোট খরচ	তুলনা করুন
2026-06-04 13:59 নতুন টেস্ট যোগ হয়েছে	9.8	10.0	$0.667	তুলনা করুন
2026-05-22 00:28 স্যুইট পরিবর্তিত হয়েছে	9.8	10.0	$0.567	তুলনা করুন
2026-05-06 13:52 স্যুইট পরিবর্তিত হয়েছে	10.0	10.0	$0.321	তুলনা করুন
2026-05-06 13:38 স্যুইট পরিবর্তিত হয়েছে	9.8	10.0	$0.320	বর্তমান রান
2026-04-23 15:25 পুনরায় পরীক্ষা	10.0	প্রযোজ্য নয়	$0.108	তুলনা করুন
2026-04-11 01:44 প্রথম নথিভুক্ত রান	10.0	প্রযোজ্য নয়	$0.314	তুলনা করুন

এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।

রান তুলনা

রান	স্কোর	ধারাবাহিকতা	নির্ভরযোগ্যতা	সঠিক টেস্ট	অস্থির টেস্ট	মোট আউটপুট টোকেন	মোট খরচ	প্রতিক্রিয়া সময় (গড়)
2026-05-06 13:38 · স্যুইট পরিবর্তিত হয়েছে	9.8	9.6	10.0	17/18	1	101,480	$0.320	11.53s
2026-04-23 15:25 · পুনরায় পরীক্ষা	10.0	10.0	প্রযোজ্য নয়	18/18	0	34,404	$0.108	12.11s
পার্থক্য	-0.2	-0.4		-1	+1	+67076	+$0.212	-582ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

Gemini 3 Flash PreviewmediumvsGemini 3.5 Flashhigh Gemini 3 Flash PreviewmediumvsQwen3.7 Maxmedium Gemini 3 Flash PreviewmediumvsGPT-5.5low Gemini 3 Flash PreviewmediumvsGemini 3.5 Flashlow Gemini 3 Flash PreviewmediumvsNemotron 3 Ultra 550b A55bmediumবিনামূল্যে উপলভ্য

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	10.0	10.0
কোডিং	10.0	10.0
সমন্বিত	10.0	10.0
ডেটা পার্সিং ও নিষ্কাশন	10.0	10.0
ডোমেইন-নির্দিষ্ট	10.0	10.0
Sadharon Buddhimotta	10.0	10.0
নির্দেশনা অনুসরণ	10.0	10.0
ধাঁধা সমাধান	9.0	7.9
টুল কলিং	10.0	10.0

Gemini 3 Flash Preview

Hamster playing table tennis

#1 Gemini 3 Flash Preview

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল