AI BENCHY
Advertise here
#40

Grok 4.3

X AI प्रकाशन: 2026-05-01 चाचणी तारीख: 2026-06-04 14:11 x-ai/grok-4.3::medium

सारांश

Grok 4.3 AI BENCHY वर 7.7 स्कोर करते आणि #40 वर आहे. याची reliability 10.0, pass rate 71.4%, एकूण खर्च $0.614, आणि सरासरी response time 47.51s आहे.

Grok 4.3 खास का आहे: हे अँटी-एआय युक्त्या मध्ये सर्वाधिक उठून दिसते, जिथे त्याचा rank #1 आहे; तर कोडी सोडवणे हा सर्वात कमकुवत भाग आहे, rank #13.

सुसंगतता

8.5

एकूण आउटपुट टोकन्स

223,363

एकूण इनपुट टोकन्स

44,472

इनपुट किंमत

$1.250 / 1M

आउटपुट किंमत

$2.500 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 8

प्रति प्रयत्न पास दर: 71.4%

अस्थिर चाचण्या

4

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

47.51s

प्रतिसाद वेळ (कमाल): 216.69s

प्रतिसाद वेळ (एकूण): 997.68s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#40 xAI: Grok 4.3

medium
Cost
$0.009
Time
19.0s
Tokens
3,661 tok

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-06-04 14:11 नवीन चाचणी जोडली 7.6 10.0 $0.614 सध्याची रन
2026-05-22 00:32 पुन्हा चाचणी 7.8 10.0 $0.593 तुलना करा
2026-05-01 00:40 पहिला रन 8.2 10.0 $0.517 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रनस्कोअरसुसंगतताविश्वसनीयताबरोबर चाचण्याअस्थिर चाचण्याएकूण आउटपुट टोकन्सएकूण इनपुट टोकन्सएकूण खर्चप्रतिसाद वेळ (सरासरी)
2026-06-04 14:11 · सध्याची रन7.78.510.013/214223,36344,472$0.61447.51s
2026-05-22 00:32 · पुन्हा चाचणी7.88.410.013/204216,4130$0.59349.23s
फरक-0.1+0.10.000+6950+44472+$0.022-1718ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-04 15:40 $1.250 / 1M $2.500 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 10.0 10.0
कोडिंग 5.9 7.7
संयुक्त 10.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 5.3 7.2
Samanya Buddhimatta 5.4 2.5
सूचनांचे पालन 9.8 10.0
कोडी सोडवणे 5.9 7.2
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स