#160 xAI: Grok 4.20
none- लागत
- $0.004
- समय
- 6.5s
- टोकन
- 1,367 tok
सारांश
Grok 4.20 AI BENCHY पर 4.4 स्कोर करता है और #160 पर है। इसकी reliability लागू नहीं, pass rate 28.6%, कुल लागत $0.057, और औसत response time 1.11s है।
Grok 4.20 को अलग क्या बनाता है: इस score range के लिए इसकी कुल benchmark लागत असामान्य रूप से कम है। यह समान मॉडलों की तुलना में काफ़ी तेज है।
पहचान नोट
Grok 4.20 Beta, Grok 4.20 का प्रीव्यू संस्करण था।
4.4
संगति
8.5
लागू नहीं
कुल आउटपुट टोकन
1,923
कुल इनपुट टोकन
41,313
इनपुट कीमत
$1.250 / 1M
आउटपुट कीमत
$2.500 / 1M
अस्थिर टेस्ट
0
अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।
जनरेशन शोकेस
Prompt: Create a detailed SVG illustration of a hamster playing table tennis.
रन इतिहास
| परीक्षण किया गया | स्कोर | विश्वसनीयता | सही परीक्षण | कुल लागत | तुलना करें |
|---|---|---|---|---|---|
| 2026-05-06 14:16 दोबारा परीक्षण | 5.4 | लागू नहीं | $0.057 ↓ | वर्तमान रन | |
| 2026-05-06 14:16 दोबारा परीक्षण | 5.4 | लागू नहीं | $0.095 | तुलना करें | |
| 2026-05-06 14:16 दोबारा परीक्षण | 5.4 | लागू नहीं | $0.095 | तुलना करें | |
| 2026-05-06 14:16 सूट बदला गया | 5.4 | लागू नहीं | $0.095 | तुलना करें | |
| 2026-04-11 01:44 पहला दर्ज रन | 5.2 | लागू नहीं | $0.095 | तुलना करें |
रन तुलना
| रन | स्कोर | संगति | विश्वसनीयता | सही परीक्षण | अस्थिर टेस्ट | कुल आउटपुट टोकन | कुल इनपुट टोकन | कुल लागत | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|---|---|---|
| 2026-05-06 14:16 · वर्तमान रन | 4.4 | 8.5 | लागू नहीं | 6/18 | 0 | 1,923 | 41,313 | $0.057 | 1.11s |
| 2026-05-06 14:16 · दोबारा परीक्षण | 5.4 | 9.5 | लागू नहीं | 6/18 | 1 | 1,967 | 0 | $0.095 | 1.11s |
| अंतर | -1.0 | -1.0 | 0 | -1 | -44 | +41313 | -$0.038 | -4ms |
कीमत का इतिहास
OpenRouter से इस मॉडल का ऐतिहासिक मूल्य डेटा।
| तारीख | इनपुट कीमत | आउटपुट कीमत |
|---|---|---|
| 2026-06-04 15:40 | $1.250 / 1M | $2.500 / 1M |
पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।
| श्रेणी | स्कोर | संगति | सही परीक्षण |
|---|---|---|---|
| एंटी-एआई ट्रिक्स | 4.8 | 10.0 | |
| कोडिंग | 1.1 | 3.1 | |
| संयुक्त | 3.0 | 10.0 | |
| डेटा पार्सिंग और निष्कर्षण | 10.0 | 10.0 | |
| डोमेन-विशिष्ट | 3.0 | 10.0 | |
| Samanya Buddhimatta | 4.8 | 10.0 | |
| निर्देश पालन | 6.3 | 10.0 | |
| पहेली समाधान | 5.3 | 10.0 | |
| टूल कॉलिंग | 10.0 | 10.0 | |
| सामान्य ज्ञान | 0.0 | 0.0 |