#207

Grok 4.20 Beta

X AI प्रकाशन: 2026-03-12 चाचणी तारीख: 2026-05-06 14:15 x-ai/grok-4.20-beta::none

(medium) (none)

सारांश

Grok 4.20 Beta AI BENCHY वर 4.4 स्कोर करते आणि #207 वर आहे. याची reliability लागू नाही, pass rate 30.3%, एकूण खर्च $0.087, आणि सरासरी response time 1.19s आहे.

Grok 4.20 Beta खास का आहे: या score range साठी एकूण benchmark खर्च असामान्यपणे कमी आहे. समान मॉडेल्सच्या तुलनेत हे लक्षणीय वेगवान आहे.

संग्रहित मॉडेल: हे मॉडेल आता अपडेट केले जाणार नाही आणि नवीन चाचण्यांवर तपासले जाणार नाही.

ओळख नोंद

Grok 4.20 Beta हे xAI: Grok 4.20 ची प्रीव्ह्यू आवृत्ती होती.

स्कोअर

4.4

सुसंगतता

7.9

विश्वसनीयता

लागू नाही

एकूण खर्च (सध्याची किंमत)

$0.087 ↓ -4.8%

या किमतीवर चाचणी केली: $0.091

एकूण आउटपुट टोकन्स

1,657

एकूण इनपुट टोकन्स

40,597

इनपुट किंमत

$2.041 / 1M

आउटपुट किंमत

$2.041 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 12

प्रति प्रयत्न पास दर: 30.3%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

1.19s

प्रतिसाद वेळ (कमाल): 6.48s

प्रतिसाद वेळ (एकूण): 21.43s

चुकीचे उत्तर: 10 सूचनांचे पालन केले नाही: 1 अवैध टूल कॉल: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#207 Grok 4.20 Beta

none

अवैध SVG

खर्च: $0.004
वेळ: 8.5s
टोकन्स: 1,672 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-05-06 14:15 पुन्हा चाचणी	4.4	लागू नाही	$0.087 ↓	सध्याची रन
2026-05-06 14:15 पुन्हा चाचणी	5.8	लागू नाही	$0.087 ↓	तुलना करा
2026-05-06 14:15 पुन्हा चाचणी	5.5	लागू नाही	$0.091	तुलना करा
2026-05-06 14:15 पुन्हा चाचणी	5.5	लागू नाही	$0.091	तुलना करा
2026-05-06 14:15 सूट बदलला	5.5	लागू नाही	$0.091	तुलना करा
2026-04-11 01:19 पहिली नोंदलेली रन	5.3	लागू नाही	$0.091	तुलना करा

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख	इनपुट किंमत	आउटपुट किंमत
2026-06-04 15:40	$2.041 / 1M	$2.041 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	4.0	8.4
कोडिंग	1.8	3.3
संयुक्त	1.5	5.0
डेटा पार्सिंग आणि निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	3.0	10.0
Samanya Buddhimatta	5.0	10.0
सूचनांचे पालन	6.3	10.0
कोडी सोडवणे	7.7	10.0
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	0.0	0.0

Grok 4.20 Beta

Hamster playing table tennis

#207 Grok 4.20 Beta

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स