AI BENCHY
Advertise here
#61

Gemma 4 26B A4B

Google प्रकाशन: 2026-04-03 चाचणी तारीख: 2026-06-04 14:22 google/gemma-4-26b-a4b-it::medium
(medium) (none)

सारांश

Gemma 4 26B A4B AI BENCHY वर 7.2 स्कोर करते आणि #61 वर आहे. याची reliability 10.0, pass rate 69.8%, एकूण खर्च $0.045, आणि सरासरी response time 63.41s आहे.

Gemma 4 26B A4B खास का आहे: हे सूचनांचे पालन मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #1 आहे; तर कोडिंग हा सर्वात कमकुवत भाग आहे, rank #14.

सुसंगतता

9.2

एकूण खर्च (सध्याची किंमत)

$0.045 ↓ -12.8%

या किमतीवर चाचणी केली: $0.051

एकूण आउटपुट टोकन्स

128,490

एकूण इनपुट टोकन्स

40,252

इनपुट किंमत

$0.060 / 1M

आउटपुट किंमत

$0.330 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 7

प्रति प्रयत्न पास दर: 69.8%

अस्थिर चाचण्या

2

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

63.41s

प्रतिसाद वेळ (कमाल): 369.32s

प्रतिसाद वेळ (एकूण): 1268.28s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#61 Gemma 4 26B A4B

medium
अवैध SVG
खर्च
$0.000
वेळ
300.0s
टोकन्स
0 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 14:22 नवीन चाचणी जोडली 7.6 8.9 $0.045 सध्याची रन
2026-05-22 00:42 सूट बदलला 7.5 10.0 $0.045 तुलना करा
2026-04-22 21:39 पहिली नोंदलेली रन 8.0 लागू नाही $0.028 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रनस्कोअरसुसंगतताविश्वसनीयताबरोबर चाचण्याअस्थिर चाचण्याएकूण आउटपुट टोकन्सएकूण इनपुट टोकन्सएकूण खर्चप्रतिसाद वेळ (सरासरी)
2026-06-04 14:22 · सध्याची रन7.29.210.014/212128,49040,252$0.04563.41s
2026-04-22 21:39 · पहिली नोंदलेली रन8.09.0लागू नाही13/18260,5590$0.02825.03s
फरक-0.9+0.2+10+67931+40252+$0.017+38386ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 15:40 $0.060 / 1M $0.330 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 10.0 10.0
कोडिंग 2.9 10.0
संयुक्त 9.6 10.0
डेटा पार्सिंग आणि निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 2.9 4.4
Samanya Buddhimatta 10.0 10.0
सूचनांचे पालन 10.0 10.0
कोडी सोडवणे 10.0 10.0
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स