Gemini 3 Flash Preview

Google प्रकाशन: 2025-12-17 चाचणी तारीख: 2026-05-06 13:38 google/gemini-3-flash-preview::medium

(medium) (low) (none)

सारांश

Gemini 3 Flash Preview AI BENCHY वर 9.8 स्कोर करते आणि #1 वर आहे. याची reliability 10.0, pass rate 98.2%, एकूण खर्च $0.320, आणि सरासरी response time 11.53s आहे.

Gemini 3 Flash Preview खास का आहे: हे डोमेन-विशिष्ट मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #1 आहे; तर कोडी सोडवणे हा सर्वात कमकुवत भाग आहे, rank #8. हे एकूणात सर्वाधिक rank असलेल्या मॉडेल्सपैकी एक आहे. या score range साठी एकूण benchmark खर्च असामान्यपणे कमी आहे.

स्कोअर

9.8

सुसंगतता

9.6

विश्वसनीयता

10.0

एकूण खर्च (सध्याची किंमत)

$0.320

एकूण आउटपुट टोकन्स

101,480

एकूण इनपुट टोकन्स

इनपुट किंमत

$0.500 / 1M

आउटपुट किंमत

$3.000 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 1

प्रति प्रयत्न पास दर: 98.2%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

11.53s

प्रतिसाद वेळ (कमाल): 74.66s

प्रतिसाद वेळ (एकूण): 207.46s

सूचनांचे पालन केले नाही: 1

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#1 Gemini 3 Flash Preview

medium

खर्च: $0.010
वेळ: 17.9s
टोकन्स: 3,236 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-06-04 13:59 नवीन चाचणी जोडली	9.8	10.0	$0.667	तुलना करा
2026-05-22 00:28 सूट बदलला	9.8	10.0	$0.567	तुलना करा
2026-05-06 13:52 सूट बदलला	10.0	10.0	$0.321	तुलना करा
2026-05-06 13:38 सूट बदलला	9.8	10.0	$0.320	सध्याची रन
2026-04-23 15:25 पुन्हा चाचणी	10.0	लागू नाही	$0.108	तुलना करा
2026-04-11 01:44 पहिली नोंदलेली रन	10.0	लागू नाही	$0.314	तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रन	स्कोअर	सुसंगतता	विश्वसनीयता	बरोबर चाचण्या	अस्थिर चाचण्या	एकूण आउटपुट टोकन्स	एकूण खर्च	प्रतिसाद वेळ (सरासरी)
2026-05-06 13:38 · सूट बदलला	9.8	9.6	10.0	17/18	1	101,480	$0.320	11.53s
2026-04-11 01:44 · पहिली नोंदलेली रन	10.0	10.0	लागू नाही	18/18	0	99,113	$0.314	17.60s
फरक	-0.2	-0.4		-1	+1	+2367	+$0.007	-6071ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

Gemini 3 Flash PreviewmediumvsGemini 3.5 Flashhigh Gemini 3 Flash PreviewmediumvsQwen3.7 Maxmedium Gemini 3 Flash PreviewmediumvsGPT-5.5low Gemini 3 Flash PreviewmediumvsGemini 3.5 Flashlow Gemini 3 Flash PreviewmediumvsNemotron 3 Ultra 550b A55bmediumमोफत उपलब्ध

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	10.0	10.0
कोडिंग	10.0	10.0
संयुक्त	10.0	10.0
डेटा पार्सिंग आणि निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	10.0	10.0
Samanya Buddhimatta	10.0	10.0
सूचनांचे पालन	10.0	10.0
कोडी सोडवणे	9.0	7.9
टूल कॉलिंग	10.0	10.0

Gemini 3 Flash Preview

Hamster playing table tennis

#1 Gemini 3 Flash Preview

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स