AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com
#86

Gemma 4 31B

Google प्रकाशन: 2026-04-02 चाचणी तारीख: 2026-06-04 14:04 google/gemma-4-31b-it::none
(medium) (none)

सारांश

Gemma 4 31B AI BENCHY वर 6.5 स्कोर करते आणि #86 वर आहे. याची reliability 10.0, pass rate 47.6%, एकूण खर्च $0.004, आणि सरासरी response time 4.05s आहे.

Gemma 4 31B खास का आहे: हे डोमेन-विशिष्ट मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #1 आहे; तर टूल कॉलिंग हा सर्वात कमकुवत भाग आहे, rank #8. या score range साठी एकूण benchmark खर्च असामान्यपणे कमी आहे.

सुसंगतता

10.0

एकूण खर्च (सध्याची किंमत)

$0.004 ↓ -9.6%

या किमतीवर चाचणी केली: $0.004

एकूण आउटपुट टोकन्स

1,407

एकूण इनपुट टोकन्स

20,911

इनपुट किंमत

$0.120 / 1M

आउटपुट किंमत

$0.360 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 11

प्रति प्रयत्न पास दर: 47.6%

अस्थिर चाचण्या

0

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

4.05s

प्रतिसाद वेळ (कमाल): 26.13s

प्रतिसाद वेळ (एकूण): 76.87s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#86 Gemma 4 31B

none
Cost
$0.001
Time
12.8s
Tokens
795 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 14:04 नवीन चाचणी जोडली 6.5 10.0 $0.004 सध्याची रन
2026-05-22 00:30 सूट बदलला 6.7 10.0 $0.003 तुलना करा
2026-04-14 00:56 पहिली नोंदलेली रन 6.9 लागू नाही $0.003 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 15:40 $0.120 / 1M $0.370 / 1M
2026-06-05 23:32 $0.120 / 1M $0.360 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 6.5 10.0
कोडिंग 5.5 10.0
संयुक्त 3.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 7.7 10.0
Samanya Buddhimatta 10.0 10.0
सूचनांचे पालन 6.5 10.0
कोडी सोडवणे 6.5 10.0
टूल कॉलिंग 3.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स