#25

Gemini 2.5 Flash

Google रिलीज़: 2025-06-17 परीक्षण किया गया: 2026-07-16 23:00 google/gemini-2.5-flash::medium

(medium) (none)

सारांश

Gemini 2.5 Flash AI BENCHY पर 8.2 स्कोर करता है और #25 पर है। इसकी reliability 10.0, pass rate 71.2%, कुल लागत $0.643, और औसत response time 21.18s है।

Gemini 2.5 Flash को अलग क्या बनाता है: यह डोमेन-विशिष्ट में सबसे अलग दिखता है, जहाँ इसकी रैंक #3 है; जबकि कोडिंग इसकी सबसे कमजोर जगह है, जहाँ यह #14 पर है।

स्कोर

8.2

संगति

9.6

विश्वसनीयता

10.0

कुल लागत (वर्तमान कीमत)

$0.643

कुल आउटपुट टोकन

241,203

कुल इनपुट टोकन

132,498

इनपुट कीमत

$0.300 / 1M

आउटपुट कीमत

$2.500 / 1M

सही परीक्षण

गलत टेस्ट: 7

प्रति प्रयास पास दर: 71.2%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

21.18s

प्रतिक्रिया समय (अधिकतम): 140.50s

प्रतिक्रिया समय (कुल): 465.89s

गलत उत्तर: 6 निर्देशों का पालन नहीं किया: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#25 Gemini 2.5 Flash

medium

अमान्य SVG

लागत: $0.000
समय: 274.0s
टोकन: 0 tok

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	कुल लागत	तुलना करें
2026-07-16 23:00 नया टेस्ट जोड़ा गया	8.2	10.0	$0.643	वर्तमान रन
2026-06-04 14:01 नया टेस्ट जोड़ा गया	7.8	10.0	$0.379	तुलना करें
2026-05-22 00:32 सूट बदला गया	7.7	10.0	$0.358	तुलना करें
2026-04-11 01:44 पहला दर्ज रन	8.2	लागू नहीं	$0.319	तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

रन तुलना

रन	स्कोर	संगति	विश्वसनीयता	सही परीक्षण	अस्थिर टेस्ट	कुल आउटपुट टोकन	कुल इनपुट टोकन	कुल लागत	प्रतिक्रिया समय (औसत)
2026-07-16 23:00 · वर्तमान रन	8.2	9.6	10.0	15/22	1	241,203	132,498	$0.643	21.18s
2026-04-11 01:44 · पहला दर्ज रन	8.2	9.5	लागू नहीं	13/18	1	124,171	0	$0.319	12.12s
अंतर	0.0	+0.1		+2	0	+117032	+132498	+$0.324	+9059ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख	इनपुट कीमत	आउटपुट कीमत
2026-06-04 15:40	$0.300 / 1M	$2.500 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

Gemini 2.5 FlashmediumvsMuse Spark 1.1low Gemini 2.5 FlashmediumvsGPT-5 Minimedium Gemini 2.5 FlashmediumvsClaude Sonnet 5medium Gemini 2.5 FlashmediumvsMuse Spark 1.1high Gemini 2.5 FlashmediumvsGrok 4.5medium Gemini 2.5 FlashmediumvsStep 3.7 Flashmedium Gemini 2.5 FlashmediumvsGemini 3 Flash Previewmedium Gemini 2.5 FlashmediumvsGemini 3.5 Flashhigh Gemini 2.5 FlashmediumvsNemotron 3 Ultramediumनिःशुल्क उपलब्ध Gemini 2.5 FlashmediumvsGPT-5.5low

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	8.4	10.0
कोडिंग	7.8	10.0
संयुक्त	10.0	10.0
डेटा पार्सिंग और निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	5.9	7.2
Samanya Buddhimatta	4.8	10.0
निर्देश पालन	9.8	10.0
पहेली समाधान	7.7	10.0
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

Gemini 2.5 Flash

Hamster playing table tennis

#25 Gemini 2.5 Flash

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

तुलना किए गए मॉडल