AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com
#160

Grok 4.20

X AI प्रकाशन: 2026-03-31 चाचणी तारीख: 2026-05-06 14:16 x-ai/grok-4.20::none
(medium) (none)

सारांश

Grok 4.20 AI BENCHY वर 4.4 स्कोर करते आणि #160 वर आहे. याची reliability लागू नाही, pass rate 28.6%, एकूण खर्च $0.057, आणि सरासरी response time 1.11s आहे.

Grok 4.20 खास का आहे: या score range साठी एकूण benchmark खर्च असामान्यपणे कमी आहे. समान मॉडेल्सच्या तुलनेत हे लक्षणीय वेगवान आहे.

ओळख नोंद

Grok 4.20 Beta हे Grok 4.20 ची प्रीव्ह्यू आवृत्ती होती.

सुसंगतता

8.5

विश्वसनीयता

लागू नाही

एकूण खर्च (सध्याची किंमत)

$0.057 ↓ -40.1%

या किमतीवर चाचणी केली: $0.095

एकूण आउटपुट टोकन्स

1,923

एकूण इनपुट टोकन्स

41,313

इनपुट किंमत

$1.250 / 1M

आउटपुट किंमत

$2.500 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 12

प्रति प्रयत्न पास दर: 28.6%

अस्थिर चाचण्या

0

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

1.11s

प्रतिसाद वेळ (कमाल): 6.04s

प्रतिसाद वेळ (एकूण): 19.96s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#160 xAI: Grok 4.20

none
खर्च
$0.004
वेळ
6.5s
टोकन्स
1,367 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-05-06 14:16 पुन्हा चाचणी 5.4 लागू नाही $0.057 सध्याची रन
2026-05-06 14:16 पुन्हा चाचणी 5.4 लागू नाही $0.095 तुलना करा
2026-05-06 14:16 पुन्हा चाचणी 5.4 लागू नाही $0.095 तुलना करा
2026-05-06 14:16 सूट बदलला 5.4 लागू नाही $0.095 तुलना करा
2026-04-11 01:44 पहिली नोंदलेली रन 5.2 लागू नाही $0.095 तुलना करा

रन तुलना

रनस्कोअरसुसंगतताविश्वसनीयताबरोबर चाचण्याअस्थिर चाचण्याएकूण आउटपुट टोकन्सएकूण इनपुट टोकन्सएकूण खर्चप्रतिसाद वेळ (सरासरी)
2026-05-06 14:16 · सध्याची रन4.48.5लागू नाही6/1801,92341,313$0.0571.11s
2026-05-06 14:16 · सूट बदलला5.49.5लागू नाही6/1811,9670$0.0951.11s
फरक-1.0-1.00-1-44+41313-$0.038-4ms

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 15:40 $1.250 / 1M $2.500 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 4.8 10.0
कोडिंग 1.1 3.1
संयुक्त 3.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 3.0 10.0
Samanya Buddhimatta 4.8 10.0
सूचनांचे पालन 6.3 10.0
कोडी सोडवणे 5.3 10.0
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 0.0 0.0

तुलना केलेली मॉडेल्स