AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com
#2

Gemini 3 Flash Preview

Google प्रकाशन: 2025-12-17 चाचणी तारीख: 2026-06-04 13:59 google/gemini-3-flash-preview::medium
(medium) (low) (none)

सारांश

Gemini 3 Flash Preview AI BENCHY वर 9.6 स्कोर करते आणि #2 वर आहे. याची reliability 10.0, pass rate 98.4%, एकूण खर्च $0.667, आणि सरासरी response time 18.64s आहे.

Gemini 3 Flash Preview खास का आहे: हे एकूणात सर्वाधिक rank असलेल्या मॉडेल्सपैकी एक आहे. हे असामान्यपणे जास्त reasoning tokens वापरते, ज्यामुळे runs हळू किंवा महाग होऊ शकतात.

सुसंगतता

9.7

एकूण आउटपुट टोकन्स

216,159

एकूण इनपुट टोकन्स

37,017

इनपुट किंमत

$0.500 / 1M

आउटपुट किंमत

$3.000 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 1

प्रति प्रयत्न पास दर: 98.4%

अस्थिर चाचण्या

1

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

18.64s

प्रतिसाद वेळ (कमाल): 117.26s

प्रतिसाद वेळ (एकूण): 391.35s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#2 Gemini 3 Flash Preview

medium
खर्च
$0.010
वेळ
17.9s
टोकन्स
3,236 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 13:59 नवीन चाचणी जोडली 9.8 10.0 $0.667 सध्याची रन
2026-05-22 00:28 सूट बदलला 9.8 10.0 $0.567 तुलना करा
2026-05-06 13:52 सूट बदलला 10.0 10.0 $0.321 तुलना करा
2026-05-06 13:38 सूट बदलला 9.8 10.0 $0.320 तुलना करा
2026-04-23 15:25 पुन्हा चाचणी 10.0 लागू नाही $0.108 तुलना करा
2026-04-11 01:44 पहिली नोंदलेली रन 10.0 लागू नाही $0.314 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रनस्कोअरसुसंगतताविश्वसनीयताबरोबर चाचण्याअस्थिर चाचण्याएकूण आउटपुट टोकन्सएकूण इनपुट टोकन्सएकूण खर्चप्रतिसाद वेळ (सरासरी)
2026-06-04 13:59 · सध्याची रन9.69.710.020/211216,15937,017$0.66718.64s
2026-05-06 13:52 · सूट बदलला10.010.010.018/180101,7710$0.32111.76s
फरक-0.4-0.30.0+2+1+114388+37017+$0.347+6880ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 15:40 $0.500 / 1M $3.000 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 10.0 10.0
कोडिंग 8.6 7.6
संयुक्त 10.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 10.0 10.0
Samanya Buddhimatta 10.0 10.0
सूचनांचे पालन 10.0 10.0
कोडी सोडवणे 10.0 10.0
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 10.0 10.0

तुलना केलेली मॉडेल्स