#13

Gemini 3 PRO Preview

Google प्रकाशन: 2025-11-18 चाचणी तारीख: 2026-04-11 01:44 google/gemini-3-pro-preview::medium

स्कोअर

8.4

सुसंगतता

10.0

विश्वसनीयता

लागू नाही

एकूण खर्च

$0.197

एकूण आउटपुट टोकन्स

11,592

???? ???

$0.000 / 1M

????? ???

$0.000 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 4

प्रति प्रयत्न पास दर: 77.8%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

9.06s

प्रतिसाद वेळ (कमाल): 26.24s

प्रतिसाद वेळ (एकूण): 90.58s

चुकीचे उत्तर: 3 API त्रुटी: 1

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-05-22 00:29 सूट बदलला	8.1	लागू नाही	$0.197	तुलना करा
2026-05-21 15:55 सूट बदलला	8.4	लागू नाही	$0.197	तुलना करा
2026-05-21 15:55 सूट बदलला	8.1	लागू नाही	$0.197	तुलना करा
2026-04-11 01:44 पहिली नोंदलेली रन	8.4	लागू नाही	$0.197	सध्याची रन

रन तुलना

रन	स्कोअर	सुसंगतता	विश्वसनीयता	बरोबर चाचण्या	एकूण आउटपुट टोकन्स	एकूण खर्च	प्रतिसाद वेळ (सरासरी)
2026-04-11 01:44 · पहिली नोंदलेली रन	8.4	10.0	लागू नाही	14/18	11,592	$0.197	9.06s
2026-05-21 15:55 · सूट बदलला	8.4	10.0	लागू नाही	14/18	11,592	$0.197	9.06s
फरक	0.0	0.0		-2	0	$0.000	0ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

Gemini 3 PRO PreviewmediumvsQwen3.6 Max Previewmedium Gemini 3 PRO PreviewmediumvsGemini 3 Flash Previewlow Gemini 3 PRO PreviewmediumvsGLM 5medium Gemini 3 PRO PreviewmediumvsGemini 3 Flash Previewmedium Gemini 3 PRO PreviewmediumvsGemini 3.5 Flashhigh Gemini 3 PRO PreviewmediumvsRing-2.6-1Tmedium Gemini 3 PRO PreviewmediumvsGemini 3.5 Flashlow

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	10.0	10.0
कोडिंग	3.0	10.0
संयुक्त	3.0	10.0
डेटा पार्सिंग आणि निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	5.3	10.0
Samanya Buddhimatta	10.0	10.0
सूचनांचे पालन	9.8	10.0
कोडी सोडवणे	10.0	10.0
टूल कॉलिंग	10.0	10.0

Gemini 3 PRO Preview

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स