AI BENCHY
Advertise here

#38

Gemini 3.1 Flash Lite Preview

Google रिलीज़: 2026-03-03 परीक्षण किया गया: 2026-05-22 00:28 google/gemini-3.1-flash-lite-preview::medium
(high) (medium) (low) (none)

पहचान नोट

Gemini 3.1 Flash Lite Preview, Google: Gemini 3.1 Flash Lite का प्रीव्यू संस्करण था।

संगति

10.0

कुल आउटपुट टोकन

35,861

इनपुट कीमत

$0.250 / 1M

आउटपुट कीमत

$1.500 / 1M

सही परीक्षण

गलत टेस्ट: 7

प्रति प्रयास पास दर: 65.0%

अस्थिर टेस्ट

0

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

3.94s

प्रतिक्रिया समय (अधिकतम): 14.93s

प्रतिक्रिया समय (कुल): 78.74s

रन इतिहास

परीक्षण किया गया स्कोर विश्वसनीयता सही परीक्षण कुल लागत तुलना करें
2026-05-22 00:28 सूट बदला गया 7.7 10.0 $0.063 वर्तमान रन
2026-04-11 01:44 पहला दर्ज रन 8.2 लागू नहीं $0.055 तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

रन तुलना

रनस्कोरसंगतिविश्वसनीयतासही परीक्षणअस्थिर टेस्टकुल आउटपुट टोकनकुल लागतप्रतिक्रिया समय (औसत)
2026-05-22 00:28 · वर्तमान रन7.710.010.013/20035,861$0.0633.94s
2026-04-11 01:44 · पहला दर्ज रन8.210.0लागू नहीं13/18031,198$0.0553.74s
अंतर-0.50.000+4663+$0.009+198ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख इनपुट कीमत आउटपुट कीमत
2026-06-01 11:25 $0.250 / 1M $1.500 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

श्रेणी स्कोर संगति सही परीक्षण
एंटी-एआई ट्रिक्स 9.1 10.0
कोडिंग 6.8 10.0
संयुक्त 10.0 10.0
डेटा पार्सिंग और निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 3.0 10.0
Samanya Buddhimatta 10.0 10.0
निर्देश पालन 10.0 10.0
पहेली समाधान 7.7 10.0
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना किए गए मॉडल