नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

OpenAI: GPT-5.4 vs xAI: Grok 4.1 Fast

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-16

मेट्रिक GPT-5.4 GPT-5.4 none रिलीज़: 2026-03-05 Grok 4.1 Fast Grok 4.1 Fast medium रिलीज़: 2025-11-19
स्कोर 5.9 6.7
रैंक #65 #51
संगति 9.1 7.2
सही परीक्षण
प्रति प्रयास पास दर 42.6% 64.8%
अस्थिर टेस्ट 2 6
कुल रन 54 54
प्रति परिणाम लागत 1.477 0.613
कुल लागत $0.104 $0.056
???? ??? $2.500 / 1M $0.200 / 1M
????? ??? $15.000 / 1M $0.500 / 1M
आउटपुट टोकन 2,317 2,010
रीजनिंग टोकन 0 91,298
प्रतिक्रिया समय (औसत) 1.51s 23.88s
प्रतिक्रिया समय (अधिकतम) 2.95s 121.79s
प्रतिक्रिया समय (कुल) 27.21s 262.66s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 3.2 8.0 8.3% 1 1.21s 406 0
Grok 4.1 Fast 8.7 7.9 91.7% 1 3.81s 108 4,741
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 2.95s 480 0
Grok 4.1 Fast 2.3 1.1 33.3% 1 23.58s 821 6,703
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 3.0 10.0 0.0% 0 2.89s 291 0
Grok 4.1 Fast 10.0 10.0 100.0% 0 37.64s 261 12,272
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 1.04s 222 0
Grok 4.1 Fast 10.0 10.0 100.0% 0 6.63s 180 5,409
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 5.3 7.2 44.4% 1 1.07s 50 0
Grok 4.1 Fast 5.8 4.4 66.7% 2 121.79s 11 37,657
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 4.4 9.9 0.0% 0 1.78s 184 0
Grok 4.1 Fast 4.2 9.9 0.0% 0 16.25s 127 3,456
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 6.5 10.0 50.0% 0 1.07s 81 0
Grok 4.1 Fast 6.6 10.0 50.0% 0 5.30s 55 3,489
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 5.6 9.8 33.3% 0 1.52s 357 0
Grok 4.1 Fast 5.3 7.2 44.4% 1 8.08s 187 6,086
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0
Grok 4.1 Fast 2.8 1.6 33.3% 1 27.71s 260 11,485

त्वरित तुलना

तुलना जोड़ी बदलें