Gemini 3 Flash Preview

Google प्रकाशन: 2025-12-17 चाचणी तारीख: 2026-04-23 15:25 google/gemini-3-flash-preview::medium

(medium) (low) (none)

सारांश

Gemini 3 Flash Preview AI BENCHY वर 10.0 स्कोर करते आणि #1 वर आहे. याची reliability लागू नाही, pass rate 100.0%, एकूण खर्च $0.108, आणि सरासरी response time 12.11s आहे.

Gemini 3 Flash Preview खास का आहे: हे एकूणात सर्वाधिक rank असलेल्या मॉडेल्सपैकी एक आहे. या score range साठी एकूण benchmark खर्च असामान्यपणे कमी आहे.

स्कोअर

10.0

सुसंगतता

10.0

विश्वसनीयता

लागू नाही

एकूण खर्च (सध्याची किंमत)

$0.108

एकूण आउटपुट टोकन्स

34,404

एकूण इनपुट टोकन्स

इनपुट किंमत

$0.500 / 1M

आउटपुट किंमत

$3.000 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 0

प्रति प्रयत्न पास दर: 100.0%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

12.11s

प्रतिसाद वेळ (कमाल): 82.37s

प्रतिसाद वेळ (एकूण): 217.93s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#1 Gemini 3 Flash Preview

medium

खर्च: $0.010
वेळ: 17.9s
टोकन्स: 3,236 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-06-04 13:59 नवीन चाचणी जोडली	9.8	10.0	$0.667	तुलना करा
2026-05-22 00:28 सूट बदलला	9.8	10.0	$0.567	तुलना करा
2026-05-06 13:52 सूट बदलला	10.0	10.0	$0.321	तुलना करा
2026-05-06 13:38 सूट बदलला	9.8	10.0	$0.320	तुलना करा
2026-04-23 15:25 पुन्हा चाचणी	10.0	लागू नाही	$0.108	सध्याची रन
2026-04-11 01:44 पहिली नोंदलेली रन	10.0	लागू नाही	$0.314	तुलना करा

रन तुलना

रन	स्कोअर	सुसंगतता	विश्वसनीयता	बरोबर चाचण्या	अस्थिर चाचण्या	एकूण आउटपुट टोकन्स	एकूण खर्च	प्रतिसाद वेळ (सरासरी)
2026-04-23 15:25 · पुन्हा चाचणी	10.0	10.0	लागू नाही	18/18	0	34,404	$0.108	12.11s
2026-05-06 13:38 · सूट बदलला	9.8	9.6	10.0	17/18	1	101,480	$0.320	11.53s
फरक	+0.2	+0.4		+1	-1	-67076	-$0.212	+582ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

Gemini 3 Flash PreviewmediumvsGemini 3.5 Flashhigh Gemini 3 Flash PreviewmediumvsQwen3.7 Maxmedium Gemini 3 Flash PreviewmediumvsGPT-5.5low Gemini 3 Flash PreviewmediumvsGemini 3.5 Flashlow Gemini 3 Flash PreviewmediumvsNemotron 3 Ultra 550b A55bmediumमोफत उपलब्ध

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	10.0	10.0
कोडिंग	10.0	10.0
संयुक्त	10.0	10.0
डेटा पार्सिंग आणि निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	10.0	10.0
Samanya Buddhimatta	10.0	10.0
सूचनांचे पालन	10.0	10.0
कोडी सोडवणे	10.0	10.0
टूल कॉलिंग	10.0	10.0

Gemini 3 Flash Preview

Hamster playing table tennis

#1 Gemini 3 Flash Preview

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स