AI BENCHY
Advertise here

#10

Gemini 3.1 Flash Lite Preview

Google रिलीज़: 2026-03-03 परीक्षण किया गया: 2026-05-06 14:01 google/gemini-3.1-flash-lite-preview::high

संग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।

पहचान नोट

Gemini 3.1 Flash Lite Preview, Google: Gemini 3.1 Flash Lite का प्रीव्यू संस्करण था।

संगति

10.0

विश्वसनीयता

लागू नहीं

कुल आउटपुट टोकन

1,534,593

इनपुट कीमत

$0.250 / 1M

आउटपुट कीमत

$1.500 / 1M

सही परीक्षण

गलत टेस्ट: 3

प्रति प्रयास पास दर: 81.3%

अस्थिर टेस्ट

0

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

68.83s

प्रतिक्रिया समय (अधिकतम): 280.52s

प्रतिक्रिया समय (कुल): 1101.32s

रन इतिहास

परीक्षण किया गया स्कोर विश्वसनीयता सही परीक्षण कुल लागत तुलना करें
2026-05-06 14:01 दोबारा परीक्षण 8.6 लागू नहीं $2.310 तुलना करें
2026-05-06 14:01 सूट बदला गया 8.6 लागू नहीं $2.310 वर्तमान रन
2026-04-10 23:27 पहला दर्ज रन 8.4 लागू नहीं $2.310 तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

श्रेणी स्कोर संगति सही परीक्षण
एंटी-एआई ट्रिक्स 10.0 10.0
संयुक्त 10.0 10.0
डेटा पार्सिंग और निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 5.3 10.0
Samanya Buddhimatta 10.0 10.0
निर्देश पालन 9.8 10.0
पहेली समाधान 7.7 10.0
टूल कॉलिंग 10.0 10.0

तुलना किए गए मॉडल