#67
Google
रिलीज़: 2025-06-17
परीक्षण किया गया: 2026-04-11 01:44
google/gemini-2.5-flash::none
(medium)
(none)
इनपुट कीमत
$0.300 / 1M
आउटपुट कीमत
$2.500 / 1M
अस्थिर टेस्ट
2
अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।
रन इतिहास
| परीक्षण किया गया | स्कोर | विश्वसनीयता | सही परीक्षण | कुल लागत | तुलना करें |
|---|---|---|---|---|---|
| 2026-05-22 00:28 सूट बदला गया | 6.2 | 10.0 | $0.015 | तुलना करें | |
| 2026-04-11 01:44 पहला दर्ज रन | 6.2 | लागू नहीं | $0.013 | वर्तमान रन |
रन तुलना
| रन | स्कोर | संगति | विश्वसनीयता | सही परीक्षण | अस्थिर टेस्ट | कुल आउटपुट टोकन | कुल लागत | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|---|---|
| 2026-04-11 01:44 · पहला दर्ज रन | 6.2 | 9.2 | लागू नहीं | 7/18 | 2 | 1,726 | $0.013 | 903ms |
| 2026-05-22 00:28 · सूट बदला गया | 6.2 | 9.2 | 10.0 | 8/20 | 2 | 1,762 | $0.015 | 893ms |
| अंतर | 0.0 | 0.0 | -1 | 0 | -36 | -$0.002 | +10ms |
इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।
चार्ट
पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।
स्कोर vs कुल लागत
प्रतिक्रिया समय (औसत)
स्कोर vs प्रतिक्रिया समय (औसत)
कुल आउटपुट टोकन
स्कोर vs कुल आउटपुट टोकन
त्वरित तुलना
Gemini 2.5 FlashnonevsGrok 4.20mediumGemini 2.5 FlashnonevsDeepSeek V3.2mediumGemini 2.5 FlashnonevsClaude Sonnet 4.6noneGemini 2.5 FlashnonevsSeed-2.0-MinimediumGemini 2.5 FlashnonevsGemma 4 31Bnoneनिःशुल्क उपलब्धGemini 2.5 FlashnonevsGemini 3 Flash PreviewmediumGemini 2.5 FlashnonevsGemini 3.5 FlashhighGemini 2.5 FlashnonevsRing-2.6-1TmediumGemini 2.5 FlashnonevsGemini 3.5 Flashlow
श्रेणी विवरण
| श्रेणी | स्कोर | संगति | सही परीक्षण |
|---|---|---|---|
| एंटी-एआई ट्रिक्स | 3.0 | 10.0 | |
| कोडिंग | 10.0 | 10.0 | |
| संयुक्त | 3.0 | 10.0 | |
| डेटा पार्सिंग और निष्कर्षण | 10.0 | 10.0 | |
| डोमेन-विशिष्ट | 5.9 | 7.2 | |
| Samanya Buddhimatta | 5.0 | 10.0 | |
| निर्देश पालन | 8.0 | 6.8 | |
| पहेली समाधान | 5.7 | 10.0 | |
| टूल कॉलिंग | 10.0 | 10.0 |