AI BENCHY तुलना
OpenAI: GPT-5.4 vs xAI: Grok 4.20
बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-10
| मेट्रिक | GPT-5.4 GPT-5.4 none | Grok 4.20 Grok 4.20 none |
|---|---|---|
| स्कोर | 5.7 | 5.4 |
| रैंक | #100 | #115 |
| विश्वसनीयता | 10.0 | लागू नहीं |
| संगति | 9.1 | 9.5 |
| सही परीक्षण | ||
| प्रति प्रयास पास दर | 40.4% | 35.2% |
| अस्थिर टेस्ट | 2 | 1 |
| कुल रन | 57 | 54 |
| प्रति परिणाम लागत | 1.493 | 1.574 |
| कुल लागत | $0.105 | $0.095 |
| ???? ??? | $2.500 / 1M | $1.250 / 1M |
| ????? ??? | $15.000 / 1M | $2.500 / 1M |
| आउटपुट टोकन | 2,357 | 1,967 |
| रीजनिंग टोकन | 0 | 0 |
| प्रतिक्रिया समय (औसत) | 1.48s | 1.11s |
| प्रतिक्रिया समय (अधिकतम) | 2.95s | 6.04s |
| प्रतिक्रिया समय (कुल) | 28.20s | 20.02s |
स्कोर बनाम कुल लागत
प्रतिक्रिया समय (औसत)
स्कोर vs प्रतिक्रिया समय (औसत)
कुल आउटपुट टोकन
स्कोर vs कुल आउटपुट टोकन
श्रेणी विवरण
त्वरित तुलना
तुलना जोड़ी बदलें
Elephant AlphamediumvsGrok 4.20noneCobuddymediumनिःशुल्क उपलब्धvsGPT-5.4noneMistral Small 4mediumvsGrok 4.20noneMiniMax M2.5mediumनिःशुल्क उपलब्धvsGrok 4.20noneMiniMax M2.5mediumनिःशुल्क उपलब्धvsGPT-5.4noneMistral Small 4mediumvsGPT-5.4noneGPT-5.4nonevsElephant AlphamediumGPT-5.4nonevsOwl AlphamediumMiniMax M2.7mediumvsGrok 4.20nonegpt-oss-120bmediumनिःशुल्क उपलब्धvsGrok 4.20noneNemotron 3 Supermediumनिःशुल्क उपलब्धvsGPT-5.4noneCobuddymediumनिःशुल्क उपलब्धvsGrok 4.20none