#156

Gemini 3.1 Flash Lite Preview

Google रिलीज़: 2026-03-03 परीक्षण किया गया: 2026-05-06 14:01 google/gemini-3.1-flash-lite-preview::high

(high) (medium) (low) (none)

सारांश

Gemini 3.1 Flash Lite Preview AI BENCHY पर 5.3 स्कोर करता है और #156 पर है। इसकी reliability लागू नहीं, pass rate 59.1%, कुल लागत $2.310, और औसत response time 68.14s है।

Gemini 3.1 Flash Lite Preview को अलग क्या बनाता है: यह Samanya Buddhimatta में सबसे अलग दिखता है, जहाँ इसकी रैंक #1 है; जबकि कोडिंग इसकी सबसे कमजोर जगह है, जहाँ यह #15 पर है। यह असामान्य रूप से अधिक reasoning tokens इस्तेमाल करता है, जिससे धीमे या महंगे runs समझ में आ सकते हैं।

संग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।

पहचान नोट

Gemini 3.1 Flash Lite Preview, Google: Gemini 3.1 Flash Lite का प्रीव्यू संस्करण था।

स्कोर

5.3

संगति

7.3

विश्वसनीयता

लागू नहीं

कुल लागत (वर्तमान कीमत)

$2.310

कुल आउटपुट टोकन

1,534,593

कुल इनपुट टोकन

28,980

इनपुट कीमत

$0.250 / 1M

आउटपुट कीमत

$1.500 / 1M

सही परीक्षण

गलत टेस्ट: 3

प्रति प्रयास पास दर: 59.1%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

68.14s

प्रतिक्रिया समय (अधिकतम): 280.52s

प्रतिक्रिया समय (कुल): 1090.28s

गलत उत्तर: 2 निर्देशों का पालन नहीं किया: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#156 Gemini 3.1 Flash Lite Preview

high

लागत: $0.096
समय: 133.9s
टोकन: 63,687 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-05-06 14:01 दोबारा परीक्षण	5.3	लागू नहीं	$2.310	वर्तमान रन
2026-05-06 14:01 दोबारा परीक्षण	8.6	लागू नहीं	$2.310	तुलना करें
2026-05-06 14:01 दोबारा परीक्षण	8.6	लागू नहीं	$2.310	तुलना करें
2026-05-06 14:01 सूट बदला गया	8.6	लागू नहीं	$2.310	तुलना करें
2026-04-10 23:27 पहला दर्ज रन	8.4	लागू नहीं	$2.310	तुलना करें

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख	इनपुट कीमत	आउटपुट कीमत
2026-06-04 15:40	$0.250 / 1M	$1.500 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

Gemini 3.1 Flash Lite PreviewhighvsGemini 3 Flash Previewmedium Gemini 3.1 Flash Lite PreviewhighvsGemini 3.5 Flashhigh Gemini 3.1 Flash Lite PreviewhighvsNemotron 3 Ultramediumनिःशुल्क उपलब्ध Gemini 3.1 Flash Lite PreviewhighvsGPT-5.5low

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	7.5	7.5
कोडिंग	0.0	0.0
संयुक्त	5.0	5.0
डेटा पार्सिंग और निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	5.3	10.0
Samanya Buddhimatta	10.0	10.0
निर्देश पालन	9.8	10.0
पहेली समाधान	7.7	10.0
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	0.0	0.0

Gemini 3.1 Flash Lite Preview

Hamster playing table tennis

#156 Gemini 3.1 Flash Lite Preview

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल