AI BENCHY
Advertise here

#40

Gemini 2.5 Flash

Google रिलीज़: 2025-06-17 परीक्षण किया गया: 2026-05-22 00:32 google/gemini-2.5-flash::medium
(medium) (none)

संगति

9.6

कुल आउटपुट टोकन

139,179

इनपुट कीमत

$0.300 / 1M

आउटपुट कीमत

$2.500 / 1M

सही परीक्षण

गलत टेस्ट: 7

प्रति प्रयास पास दर: 68.3%

अस्थिर टेस्ट

1

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

15.57s

प्रतिक्रिया समय (अधिकतम): 95.48s

प्रतिक्रिया समय (कुल): 311.47s

रन इतिहास

परीक्षण किया गया स्कोर विश्वसनीयता सही परीक्षण कुल लागत तुलना करें
2026-05-22 00:32 सूट बदला गया 7.7 10.0 $0.358 वर्तमान रन
2026-04-11 01:44 पहला दर्ज रन 8.2 लागू नहीं $0.319 तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख इनपुट कीमत आउटपुट कीमत
2026-06-01 11:25 $0.300 / 1M $2.500 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

श्रेणी स्कोर संगति सही परीक्षण
एंटी-एआई ट्रिक्स 8.4 10.0
कोडिंग 6.6 10.0
संयुक्त 10.0 10.0
डेटा पार्सिंग और निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 5.9 7.2
Samanya Buddhimatta 4.8 10.0
निर्देश पालन 9.8 10.0
पहेली समाधान 7.7 10.0
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना किए गए मॉडल