#67
Google
प्रकाशन: 2025-06-17
चाचणी तारीख: 2026-04-11 01:44
google/gemini-2.5-flash::none
(medium)
(none)
इनपुट किंमत
$0.300 / 1M
आउटपुट किंमत
$2.500 / 1M
अस्थिर चाचण्या
2
अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).
रन इतिहास
| चाचणी तारीख | स्कोअर | विश्वसनीयता | बरोबर चाचण्या | एकूण खर्च | तुलना करा |
|---|---|---|---|---|---|
| 2026-05-22 00:28 सूट बदलला | 6.2 | 10.0 | $0.015 | तुलना करा | |
| 2026-04-11 01:44 पहिली नोंदलेली रन | 6.2 | लागू नाही | $0.013 | सध्याची रन |
रन तुलना
| रन | स्कोअर | सुसंगतता | विश्वसनीयता | बरोबर चाचण्या | अस्थिर चाचण्या | एकूण आउटपुट टोकन्स | एकूण खर्च | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|---|---|
| 2026-04-11 01:44 · पहिली नोंदलेली रन | 6.2 | 9.2 | लागू नाही | 7/18 | 2 | 1,726 | $0.013 | 903ms |
| 2026-05-22 00:28 · सूट बदलला | 6.2 | 9.2 | 10.0 | 8/20 | 2 | 1,762 | $0.015 | 893ms |
| फरक | 0.0 | 0.0 | -1 | 0 | -36 | -$0.002 | +10ms |
या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.
चार्ट्स
पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.
स्कोअर vs एकूण खर्च
प्रतिसाद वेळ (सरासरी)
स्कोअर vs प्रतिसाद वेळ (सरासरी)
एकूण आउटपुट टोकन्स
स्कोअर vs एकूण आउटपुट टोकन्स
झटपट तुलना
Gemini 2.5 FlashnonevsGrok 4.20mediumGemini 2.5 FlashnonevsDeepSeek V3.2mediumGemini 2.5 FlashnonevsClaude Sonnet 4.6noneGemini 2.5 FlashnonevsSeed-2.0-MinimediumGemini 2.5 FlashnonevsGemma 4 31Bnoneमोफत उपलब्धGemini 2.5 FlashnonevsGemini 3 Flash PreviewmediumGemini 2.5 FlashnonevsGemini 3.5 FlashhighGemini 2.5 FlashnonevsRing-2.6-1TmediumGemini 2.5 FlashnonevsGemini 3.5 Flashlow
श्रेणीवार तपशील
| श्रेणी | स्कोअर | सुसंगतता | बरोबर चाचण्या |
|---|---|---|---|
| अँटी-एआय युक्त्या | 3.0 | 10.0 | |
| कोडिंग | 10.0 | 10.0 | |
| संयुक्त | 3.0 | 10.0 | |
| डेटा पार्सिंग आणि निष्कर्षण | 10.0 | 10.0 | |
| डोमेन-विशिष्ट | 5.9 | 7.2 | |
| Samanya Buddhimatta | 5.0 | 10.0 | |
| सूचनांचे पालन | 8.0 | 6.8 | |
| कोडी सोडवणे | 5.7 | 10.0 | |
| टूल कॉलिंग | 10.0 | 10.0 |