AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

#14

Gemini 3.1 Flash Lite Preview

Google रिलीज़: 2026-03-03 परीक्षण किया गया: 2026-05-06 14:01 google/gemini-3.1-flash-lite-preview::high

संग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।

पहचान नोट

Gemini 3.1 Flash Lite Preview, Google: Gemini 3.1 Flash Lite का प्रीव्यू संस्करण था।

संगति

10.0

विश्वसनीयता

लागू नहीं

कुल आउटपुट टोकन

1,534,593

इनपुट कीमत

$0.250 / 1M

आउटपुट कीमत

$1.500 / 1M

सही परीक्षण

गलत टेस्ट: 3

प्रति प्रयास पास दर: 81.3%

अस्थिर टेस्ट

0

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

68.14s

प्रतिक्रिया समय (अधिकतम): 280.52s

प्रतिक्रिया समय (कुल): 1090.28s

रन इतिहास

परीक्षण किया गया स्कोर विश्वसनीयता सही परीक्षण कुल लागत तुलना करें
2026-05-06 14:01 दोबारा परीक्षण 8.6 लागू नहीं $2.310 वर्तमान रन
2026-05-06 14:01 सूट बदला गया 8.6 लागू नहीं $2.310 तुलना करें
2026-04-10 23:27 पहला दर्ज रन 8.4 लागू नहीं $2.310 तुलना करें

रन तुलना

रनस्कोरसंगतिविश्वसनीयतासही परीक्षणअस्थिर टेस्टकुल आउटपुट टोकनकुल लागतप्रतिक्रिया समय (औसत)
2026-05-06 14:01 · वर्तमान रन8.610.0लागू नहीं13/1601,534,593$2.31068.14s
2026-04-10 23:27 · पहला दर्ज रन8.49.6लागू नहीं12/1611,534,593$2.31068.83s
अंतर+0.2+0.4+1-10-$0.001-690ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख इनपुट कीमत आउटपुट कीमत
2026-06-01 11:25 $0.250 / 1M $1.500 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

श्रेणी स्कोर संगति सही परीक्षण
एंटी-एआई ट्रिक्स 10.0 10.0
संयुक्त 10.0 10.0
डेटा पार्सिंग और निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 5.3 10.0
Samanya Buddhimatta 10.0 10.0
निर्देश पालन 9.8 10.0
पहेली समाधान 7.7 10.0
टूल कॉलिंग 10.0 10.0

तुलना किए गए मॉडल