#83

Grok 4.3

X AI प्रकाशन: 2026-05-01 चाचणी तारीख: 2026-07-16 23:07 x-ai/grok-4.3::medium

सारांश

Grok 4.3 AI BENCHY वर 7.1 स्कोर करते आणि #83 वर आहे. याची reliability 10.0, pass rate 68.2%, एकूण खर्च $0.779, आणि सरासरी response time 47.45s आहे.

स्कोअर

7.1

सुसंगतता

8.6

विश्वसनीयता

10.0

एकूण खर्च (सध्याची किंमत)

$0.779

एकूण आउटपुट टोकन्स

241,421

एकूण इनपुट टोकन्स

140,031

इनपुट किंमत

$1.250 / 1M

आउटपुट किंमत

$2.500 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 9

प्रति प्रयत्न पास दर: 68.2%

अस्थिर चाचण्या

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

47.45s

प्रतिसाद वेळ (कमाल): 216.69s

प्रतिसाद वेळ (एकूण): 1043.83s

चुकीचे उत्तर: 5 सूचनांचे पालन केले नाही: 2 अतिरिक्त फॉरमॅटिंग: 1 उत्तर नाही: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#83 xAI: Grok 4.3

medium

खर्च: $0.009
वेळ: 19.0s
टोकन्स: 3,661 tok

रन इतिहास

चाचणी तारीख	स्कोअर	विश्वसनीयता	एकूण खर्च	तुलना करा
2026-07-16 23:07 नवीन चाचणी जोडली	7.1	10.0	$0.779	सध्याची रन
2026-06-04 14:11 नवीन चाचणी जोडली	7.6	10.0	$0.614	तुलना करा
2026-05-22 00:32 पुन्हा चाचणी	7.8	10.0	$0.593	तुलना करा
2026-05-01 00:40 पहिला रन	8.2	10.0	$0.517	तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख	इनपुट किंमत	आउटपुट किंमत
2026-06-04 15:40	$1.250 / 1M	$2.500 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

Grok 4.3mediumvsQwen3.5-122B-A10Bmedium Grok 4.3mediumvsGLM 5.1medium Grok 4.3mediumvsQwen3.7 Plusnone Grok 4.3mediumvsGrok 4.20medium Grok 4.3mediumvsQwen3.5 Plus 2026-04-20medium Grok 4.3mediumvsDeepSeek V3.2medium Grok 4.3mediumvsKAT-Coder-Pro V2.5high Grok 4.3mediumvsKimi K2.5medium Grok 4.3mediumvsKimi K2.6medium Grok 4.3mediumvsMercury 2medium

श्रेणीवार तपशील

श्रेणी	स्कोअर	सुसंगतता
अँटी-एआय युक्त्या	10.0	10.0
कोडिंग	5.9	7.7
संयुक्त	6.5	10.0
डेटा पार्सिंग आणि निष्कर्षण	10.0	10.0
डोमेन-विशिष्ट	5.3	7.2
Samanya Buddhimatta	5.4	2.5
सूचनांचे पालन	9.8	10.0
कोडी सोडवणे	5.9	7.2
टूल कॉलिंग	10.0	10.0
सामान्य ज्ञान	3.0	10.0

Grok 4.3

Hamster playing table tennis

#83 xAI: Grok 4.3

चार्ट्स

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर vs एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

तुलना केलेली मॉडेल्स