#5 Gemini 3.5 Flash
medium- लागत
- $0.201
- समय
- 112.9s
- टोकन
- 22,371 tok
सारांश
Gemini 3.5 Flash AI BENCHY पर 9.2 स्कोर करता है और #5 पर है। इसकी reliability 10.0, pass rate 89.5%, कुल लागत $0.393, और औसत response time 3.90s है।
Gemini 3.5 Flash को अलग क्या बनाता है: यह कुल मिलाकर सबसे ऊँची रैंक वाले मॉडलों में से एक है। इस score range के लिए इसकी कुल benchmark लागत असामान्य रूप से कम है। यह समान मॉडलों की तुलना में काफ़ी तेज है।
9.2
संगति
10.0
10.0
$0.393
कुल आउटपुट टोकन
38,630
कुल इनपुट टोकन
0
इनपुट कीमत
$1.500 / 1M
आउटपुट कीमत
$9.000 / 1M
अस्थिर टेस्ट
0
अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।
जनरेशन शोकेस
Prompt: Create a detailed SVG illustration of a hamster playing table tennis.
रन इतिहास
| परीक्षण किया गया | स्कोर | विश्वसनीयता | सही परीक्षण | कुल लागत | तुलना करें |
|---|---|---|---|---|---|
| 2026-06-04 14:03 नया टेस्ट जोड़ा गया | 9.0 | 10.0 | $0.582 | तुलना करें | |
| 2026-05-22 00:29 दोबारा परीक्षण | 9.0 | 10.0 | $0.472 | तुलना करें | |
| 2026-05-19 23:35 पहला रन | 9.2 | 10.0 | $0.393 | वर्तमान रन |
रन तुलना
| रन | स्कोर | संगति | विश्वसनीयता | सही परीक्षण | अस्थिर टेस्ट | कुल आउटपुट टोकन | कुल इनपुट टोकन | कुल लागत | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|---|---|---|
| 2026-05-19 23:35 · पहला रन | 9.2 | 10.0 | 10.0 | 17/19 | 0 | 38,630 | 0 | $0.393 | 3.90s |
| 2026-05-22 00:29 · दोबारा परीक्षण | 9.0 | 9.6 | 10.0 | 17/20 | 1 | 46,787 | 0 | $0.472 | 4.29s |
| अंतर | +0.3 | +0.4 | 0.0 | 0 | -1 | -8157 | 0 | -$0.080 | -385ms |
इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।
पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।
| श्रेणी | स्कोर | संगति | सही परीक्षण |
|---|---|---|---|
| एंटी-एआई ट्रिक्स | 10.0 | 10.0 | |
| कोडिंग | 10.0 | 10.0 | |
| संयुक्त | 10.0 | 10.0 | |
| डेटा पार्सिंग और निष्कर्षण | 10.0 | 10.0 | |
| डोमेन-विशिष्ट | 7.7 | 10.0 | |
| Samanya Buddhimatta | 10.0 | 10.0 | |
| निर्देश पालन | 9.9 | 10.0 | |
| पहेली समाधान | 7.7 | 10.0 | |
| टूल कॉलिंग | 10.0 | 10.0 | |
| सामान्य ज्ञान | 10.0 | 10.0 |