#19

Gemini 3 PRO Preview

Google रिलीज़: 2025-11-18 परीक्षण किया गया: 2026-05-22 00:29 google/gemini-3-pro-preview::medium

सारांश

Gemini 3 PRO Preview AI BENCHY पर 8.1 स्कोर करता है और #19 पर है। इसकी reliability लागू नहीं, pass rate 73.7%, कुल लागत $0.197, और औसत response time 9.06s है।

संग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।

स्कोर

8.1

संगति

10.0

विश्वसनीयता

लागू नहीं

कुल लागत (वर्तमान कीमत)

$0.197

कुल आउटपुट टोकन

11,592

कुल इनपुट टोकन

इनपुट कीमत

$0.000 / 1M

आउटपुट कीमत

$0.000 / 1M

सही परीक्षण

गलत टेस्ट: 5

प्रति प्रयास पास दर: 73.7%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

9.06s

प्रतिक्रिया समय (अधिकतम): 26.24s

प्रतिक्रिया समय (कुल): 90.58s

गलत उत्तर: 3 API त्रुटि: 1 कोई उत्तर नहीं: 1

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#19 Gemini 3 PRO Preview

medium

No endpoints found for google/gemini-3-pro-preview.

लागत: $0.000
समय: 0.1s
टोकन: 0 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-06-04 14:03 नया टेस्ट जोड़ा गया	7.6	लागू नहीं	$0.385 ↑	तुलना करें
2026-05-22 00:29 सूट बदला गया	8.1	लागू नहीं	$0.197	वर्तमान रन
2026-04-11 01:44 पहला दर्ज रन	8.4	लागू नहीं	$0.197	तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

रन तुलना

रन	स्कोर	संगति	विश्वसनीयता	सही परीक्षण	कुल आउटपुट टोकन	कुल लागत	प्रतिक्रिया समय (औसत)
2026-05-22 00:29 · सूट बदला गया	8.1	10.0	लागू नहीं	14/19	11,592	$0.197	9.06s
2026-04-11 01:44 · पहला दर्ज रन	8.4	10.0	लागू नहीं	14/18	11,592	$0.197	9.06s
अंतर	-0.3	0.0		+1	0	$0.000	0ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

Gemini 3 PRO PreviewmediumvsGemini 3.5 Flashhigh Gemini 3 PRO PreviewmediumvsGemini 3 Flash Previewmedium Gemini 3 PRO PreviewmediumvsNemotron 3 Ultra 550b A55bmediumनिःशुल्क उपलब्ध Gemini 3 PRO PreviewmediumvsGPT-5.5low

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	10.0	10.0
कोडिंग	3.0	10.0
संयुक्त	3.0	10.0
डेटा पार्सिंग और निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	5.3	10.0
Samanya Buddhimatta	10.0	10.0
निर्देश पालन	9.8	10.0
पहेली समाधान	10.0	10.0
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	0.0	0.0

Gemini 3 PRO Preview

Hamster playing table tennis

#19 Gemini 3 PRO Preview

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल