#13

Gemini 3.1 Flash Lite Preview

Google প্রকাশ: 2026-03-03 পরীক্ষিত হয়েছে: 2026-05-06 14:01 google/gemini-3.1-flash-lite-preview::high

(high) (medium) (low) (none)

সারাংশ

Gemini 3.1 Flash Lite Preview AI BENCHY-তে 8.6 স্কোর করে এবং #13 স্থানে আছে। এর reliability প্রযোজ্য নয়, pass rate 81.3%, মোট খরচ $2.310, এবং গড় response time 68.83s.

Gemini 3.1 Flash Lite Preview কে আলাদা করে যা: এটি অস্বাভাবিকভাবে বেশি reasoning tokens ব্যবহার করে, যা ধীর বা বেশি খরচের runs ব্যাখ্যা করতে পারে।

আর্কাইভড মডেল: এই মডেল আর আপডেট করা হবে না এবং নতুন টেস্টে পরীক্ষা করা হবে না।

পরিচয় নোট

Gemini 3.1 Flash Lite Preview ছিল Google: Gemini 3.1 Flash Lite-এর প্রিভিউ সংস্করণ।

স্কোর

8.6

ধারাবাহিকতা

10.0

নির্ভরযোগ্যতা

প্রযোজ্য নয়

মোট খরচ (বর্তমান মূল্য)

$2.310

মোট আউটপুট টোকেন

1,534,593

মোট ইনপুট টোকেন

ইনপুট মূল্য

$0.250 / 1M

আউটপুট মূল্য

$1.500 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 3

প্রতি চেষ্টায় পাস রেট: 81.3%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

68.83s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 280.52s

প্রতিক্রিয়া সময় (মোট): 1101.32s

ভুল উত্তর: 3

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#13 Gemini 3.1 Flash Lite Preview

high

খরচ: $0.096
সময়: 133.9s
টোকেন: 63,687 tok

রান ইতিহাস

পরীক্ষিত হয়েছে	স্কোর	নির্ভরযোগ্যতা	মোট খরচ	তুলনা করুন
2026-05-06 14:01 পুনরায় পরীক্ষা	8.6	প্রযোজ্য নয়	$2.310	তুলনা করুন
2026-05-06 14:01 পুনরায় পরীক্ষা	8.6	প্রযোজ্য নয়	$2.310	বর্তমান রান
2026-05-06 14:01 স্যুইট পরিবর্তিত হয়েছে	8.6	প্রযোজ্য নয়	$2.310	তুলনা করুন
2026-04-10 23:27 প্রথম নথিভুক্ত রান	8.4	প্রযোজ্য নয়	$2.310	তুলনা করুন

রান তুলনা

রান	স্কোর	ধারাবাহিকতা	নির্ভরযোগ্যতা	সঠিক টেস্ট	অস্থির টেস্ট	মোট আউটপুট টোকেন	মোট খরচ	প্রতিক্রিয়া সময় (গড়)
2026-05-06 14:01 · পুনরায় পরীক্ষা	8.6	10.0	প্রযোজ্য নয়	13/16	0	1,534,593	$2.310	68.83s
2026-04-10 23:27 · প্রথম নথিভুক্ত রান	8.4	9.6	প্রযোজ্য নয়	12/16	1	1,534,593	$2.310	68.83s
পার্থক্য	+0.2	+0.4		+1	-1	0	$0.000	0ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

Gemini 3.1 Flash Lite PreviewhighvsGemini 3.5 Flashhigh Gemini 3.1 Flash Lite PreviewhighvsGemini 3 Flash Previewmedium Gemini 3.1 Flash Lite PreviewhighvsNemotron 3 Ultra 550b A55bmediumবিনামূল্যে উপলভ্য Gemini 3.1 Flash Lite PreviewhighvsGPT-5.5low

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	10.0	10.0
সমন্বিত	10.0	10.0
ডেটা পার্সিং ও নিষ্কাশন	10.0	10.0
ডোমেইন-নির্দিষ্ট	5.3	10.0
Sadharon Buddhimotta	10.0	10.0
নির্দেশনা অনুসরণ	9.8	10.0
ধাঁধা সমাধান	7.7	10.0
টুল কলিং	10.0	10.0

Gemini 3.1 Flash Lite Preview

Hamster playing table tennis

#13 Gemini 3.1 Flash Lite Preview

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল