AI BENCHY
Advertise here
#98

Gemma 4 31B

Google प्रकाशन: 2026-04-02 चाचणी तारीख: 2026-06-04 14:04 google/gemma-4-31b-it::none
(medium) (none)

सारांश

Gemma 4 31B AI BENCHY वर 6.1 स्कोर करते आणि #98 वर आहे. याची reliability 10.0, pass rate 47.6%, एकूण खर्च $0.004, आणि सरासरी response time 4.05s आहे.

Gemma 4 31B खास का आहे: हे अँटी-एआय युक्त्या मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #4 आहे; तर टूल कॉलिंग हा सर्वात कमकुवत भाग आहे, rank #14. या score range साठी एकूण benchmark खर्च असामान्यपणे कमी आहे.

सुसंगतता

10.0

एकूण खर्च (सध्याची किंमत)

$0.004 ↓ -10.0%

या किमतीवर चाचणी केली: $0.004

एकूण आउटपुट टोकन्स

1,407

एकूण इनपुट टोकन्स

20,911

इनपुट किंमत

$0.120 / 1M

आउटपुट किंमत

$0.350 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 11

प्रति प्रयत्न पास दर: 47.6%

अस्थिर चाचण्या

0

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

4.05s

प्रतिसाद वेळ (कमाल): 26.13s

प्रतिसाद वेळ (एकूण): 76.87s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#98 Gemma 4 31B

none
खर्च
$0.001
वेळ
12.8s
टोकन्स
795 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 14:04 नवीन चाचणी जोडली 6.5 10.0 $0.004 सध्याची रन
2026-05-22 00:30 सूट बदलला 6.7 10.0 $0.003 तुलना करा
2026-04-14 00:56 पहिली नोंदलेली रन 6.9 लागू नाही $0.003 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रनस्कोअरसुसंगतताविश्वसनीयताबरोबर चाचण्याअस्थिर चाचण्याएकूण आउटपुट टोकन्सएकूण इनपुट टोकन्सएकूण खर्चप्रतिसाद वेळ (सरासरी)
2026-06-04 14:04 · सध्याची रन6.110.010.010/2101,40720,911$0.0044.05s
2026-04-14 00:56 · पहिली नोंदलेली रन6.910.0लागू नाही10/1801,3590$0.0034.02s
फरक-0.80.000+48+20911+$0.001+26ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 15:40 $0.120 / 1M $0.370 / 1M
2026-06-05 23:32 $0.120 / 1M $0.360 / 1M
2026-06-12 18:42 $0.120 / 1M $0.350 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 6.5 10.0
कोडिंग 5.5 10.0
संयुक्त 3.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 7.7 10.0
Samanya Buddhimatta 10.0 10.0
सूचनांचे पालन 6.5 10.0
कोडी सोडवणे 6.5 10.0
टूल कॉलिंग 3.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स