AI BENCHY
Advertise here
#119

Grok 4.1 Fast

X AI रिलीज़: 2025-11-19 परीक्षण किया गया: 2026-05-08 13:52 x-ai/grok-4.1-fast::medium
(medium) (none)

सारांश

Grok 4.1 Fast AI BENCHY पर 5.6 स्कोर करता है और #119 पर है। इसकी reliability 10.0, pass rate 55.6%, कुल लागत $0.069, और औसत response time 23.85s है।

Grok 4.1 Fast को अलग क्या बनाता है: यह एंटी-एआई ट्रिक्स में सबसे अलग दिखता है, जहाँ इसकी रैंक #1 है; जबकि टूल कॉलिंग इसकी सबसे कमजोर जगह है, जहाँ यह #11 पर है। यह असामान्य रूप से अधिक reasoning tokens इस्तेमाल करता है, जिससे धीमे या महंगे runs समझ में आ सकते हैं।

संग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।

संगति

6.6

कुल लागत (वर्तमान कीमत)

$0.069 ↑ +18.3%

परीक्षण के समय: $0.058

कुल आउटपुट टोकन

98,340

कुल इनपुट टोकन

42,845

इनपुट कीमत

$0.484 / 1M

आउटपुट कीमत

$0.484 / 1M

सही परीक्षण

गलत टेस्ट: 10

प्रति प्रयास पास दर: 55.6%

अस्थिर टेस्ट

6

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

23.85s

प्रतिक्रिया समय (अधिकतम): 121.79s

प्रतिक्रिया समय (कुल): 286.16s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#119 Grok 4.1 Fast

medium
Grok 4.1 Fast is deprecated. xAI recommends switching to Grok 4.3 (https://openrouter.ai/x-ai/grok-4.3)
लागत
$0.000
समय
0.1s
टोकन
0 tok

रन इतिहास

परीक्षण किया गया स्कोर विश्वसनीयता सही परीक्षण कुल लागत तुलना करें
2026-05-08 13:52 दोबारा परीक्षण 6.5 10.0 $0.069 वर्तमान रन
2026-05-08 13:52 दोबारा परीक्षण 6.5 10.0 $0.058 तुलना करें
2026-05-08 13:52 सूट बदला गया 6.5 10.0 $0.058 तुलना करें
2026-04-11 01:44 पहला दर्ज रन 6.7 लागू नहीं $0.056 तुलना करें

रन तुलना

रनस्कोरसंगतिविश्वसनीयतासही परीक्षणअस्थिर टेस्टकुल आउटपुट टोकनकुल इनपुट टोकनकुल लागतप्रतिक्रिया समय (औसत)
2026-05-08 13:52 · वर्तमान रन5.66.610.09/19698,34042,845$0.06923.85s
2026-04-11 01:44 · पहला दर्ज रन6.77.2लागू नहीं9/18693,3080$0.05623.88s
अंतर-1.1-0.600+5032+42845+$0.014-32ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

कीमत का इतिहास

OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।

तारीख इनपुट कीमत आउटपुट कीमत
2026-06-04 15:40 $0.484 / 1M $0.484 / 1M

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

श्रेणी स्कोर संगति सही परीक्षण
एंटी-एआई ट्रिक्स 8.7 7.9
कोडिंग 7.8 4.0
संयुक्त 10.0 10.0
डेटा पार्सिंग और निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 5.8 4.4
Samanya Buddhimatta 4.2 9.9
निर्देश पालन 6.5 10.0
पहेली समाधान 5.3 7.2
टूल कॉलिंग 2.8 1.6
सामान्य ज्ञान 3.0 10.0

तुलना किए गए मॉडल