#65

Gemini 3.1 Flash Lite

Google प्रकाशन: 2026-05-08 चाचणी तारीख: 2026-05-08 12:00 google/gemini-3.1-flash-lite::minimal

(high) (medium) (low) (minimal) (none)

सारांश

Gemini 3.1 Flash Lite AI BENCHY वर 7.0 स्कोर करते आणि #65 वर आहे. याची reliability 10.0, pass rate 63.0%, एकूण खर्च $0.012, आणि सरासरी response time 1.44s आहे.

Gemini 3.1 Flash Lite खास का आहे: हे कोडिंग मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #1 आहे; तर Samanya Buddhimatta हा सर्वात कमकुवत भाग आहे, rank #15. या score range साठी एकूण benchmark खर्च असामान्यपणे कमी आहे. समान मॉडेल्सच्या तुलनेत हे लक्षणीय वेगवान आहे.

स्कोअर

7.0

सुसंगतता

8.6

विश्वसनीयता

10.0

एकूण खर्च (सध्याची किंमत)

$0.012

एकूण आउटपुट टोकन्स

2,448

एकूण इनपुट टोकन्स

इनपुट किंमत

$0.250 / 1M

आउटपुट किंमत

$1.500 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 8

प्रति प्रयत्न पास दर: 63.0%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

1.44s

प्रतिसाद वेळ (कमाल): 4.49s

प्रतिसाद वेळ (एकूण): 26.00s

चुकीचे उत्तर: 5 सूचनांचे पालन केले नाही: 3

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#65 Gemini 3.1 Flash Lite

minimal

खर्च: $0.001
वेळ: 3.7s
टोकन्स: 635 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-06-04 13:59 नवीन चाचणी जोडली	6.4	10.0	$0.013	तुलना करा
2026-05-22 00:26 सूट बदलला	6.7	10.0	$0.013	तुलना करा
2026-05-08 12:00 पहिला रन	7.0	10.0	$0.012	सध्याची रन

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	8.3	10.0
कोडिंग	10.0	10.0
संयुक्त	3.0	10.0
डेटा पार्सिंग आणि निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	2.9	7.2
Samanya Buddhimatta	4.0	10.0
सूचनांचे पालन	10.0	10.0
कोडी सोडवणे	6.0	4.6
टूल कॉलिंग	10.0	10.0

Gemini 3.1 Flash Lite

Hamster playing table tennis

#65 Gemini 3.1 Flash Lite

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स