#12

Gemini 3.1 Flash Lite Preview

Google প্রকাশ: 2026-03-03 পরীক্ষিত হয়েছে: 2026-04-10 23:27 google/gemini-3.1-flash-lite-preview::high

(high) (medium) (low) (none)

সারাংশ

Gemini 3.1 Flash Lite Preview AI BENCHY-তে 8.4 স্কোর করে এবং #12 স্থানে আছে। এর reliability প্রযোজ্য নয়, pass rate 77.1%, মোট খরচ $2.310, এবং গড় response time 68.83s.

Gemini 3.1 Flash Lite Preview কে আলাদা করে যা: এটি অস্বাভাবিকভাবে বেশি reasoning tokens ব্যবহার করে, যা ধীর বা বেশি খরচের runs ব্যাখ্যা করতে পারে।

আর্কাইভড মডেল: এই মডেল আর আপডেট করা হবে না এবং নতুন টেস্টে পরীক্ষা করা হবে না।

পরিচয় নোট

Gemini 3.1 Flash Lite Preview ছিল Google: Gemini 3.1 Flash Lite-এর প্রিভিউ সংস্করণ।

স্কোর

8.4

ধারাবাহিকতা

9.6

নির্ভরযোগ্যতা

প্রযোজ্য নয়

মোট খরচ (বর্তমান মূল্য)

$2.310

মোট আউটপুট টোকেন

1,534,593

মোট ইনপুট টোকেন

ইনপুট মূল্য

$0.250 / 1M

আউটপুট মূল্য

$1.500 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 4

প্রতি চেষ্টায় পাস রেট: 77.1%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

68.83s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 280.52s

প্রতিক্রিয়া সময় (মোট): 1101.32s

ভুল উত্তর: 3 নির্দেশনা অনুসরণ করা হয়নি: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#12 Gemini 3.1 Flash Lite Preview

high

খরচ: $0.096
সময়: 133.9s
টোকেন: 63,687 tok

রান ইতিহাস

পরীক্ষিত হয়েছে	স্কোর	নির্ভরযোগ্যতা	মোট খরচ	তুলনা করুন
2026-05-06 14:01 পুনরায় পরীক্ষা	5.3	প্রযোজ্য নয়	$2.310	তুলনা করুন
2026-05-06 14:01 পুনরায় পরীক্ষা	8.6	প্রযোজ্য নয়	$2.310	তুলনা করুন
2026-05-06 14:01 পুনরায় পরীক্ষা	8.6	প্রযোজ্য নয়	$2.310	তুলনা করুন
2026-05-06 14:01 স্যুইট পরিবর্তিত হয়েছে	8.6	প্রযোজ্য নয়	$2.310	তুলনা করুন
2026-04-10 23:27 প্রথম নথিভুক্ত রান	8.4	প্রযোজ্য নয়	$2.310	বর্তমান রান

রান তুলনা

রান	স্কোর	ধারাবাহিকতা	নির্ভরযোগ্যতা	সঠিক টেস্ট	অস্থির টেস্ট	মোট আউটপুট টোকেন	মোট খরচ	প্রতিক্রিয়া সময় (গড়)
2026-04-10 23:27 · প্রথম নথিভুক্ত রান	8.4	9.6	প্রযোজ্য নয়	12/16	1	1,534,593	$2.310	68.83s
2026-05-06 14:01 · স্যুইট পরিবর্তিত হয়েছে	8.6	10.0	প্রযোজ্য নয়	13/16	0	1,534,593	$2.310	68.83s
পার্থক্য	-0.2	-0.4		-1	+1	0	$0.000	0ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

Gemini 3.1 Flash Lite PreviewhighvsGemini 3 Flash Previewmedium Gemini 3.1 Flash Lite PreviewhighvsGemini 3.5 Flashhigh Gemini 3.1 Flash Lite PreviewhighvsNemotron 3 Ultramediumবিনামূল্যে উপলভ্য Gemini 3.1 Flash Lite PreviewhighvsGPT-5.5low

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	10.0	10.0
সমন্বিত	10.0	10.0
ডেটা পার্সিং ও নিষ্কাশন	10.0	10.0
ডোমেইন-নির্দিষ্ট	5.3	10.0
Sadharon Buddhimotta	10.0	10.0
নির্দেশনা অনুসরণ	7.9	6.9
ধাঁধা সমাধান	7.7	10.0
টুল কলিং	10.0	10.0

Gemini 3.1 Flash Lite Preview

Hamster playing table tennis

#12 Gemini 3.1 Flash Lite Preview

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল