AI BENCHY तुलना
OpenAI: GPT-5.2 vs xAI: Grok 4.20
बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-10
| मेट्रिक | GPT-5.2 GPT-5.2 medium | Grok 4.20 Grok 4.20 medium |
|---|---|---|
| स्कोर | 7.2 | 6.9 |
| रैंक | #60 | #68 |
| विश्वसनीयता | 10.0 | 10.0 |
| संगति | 8.2 | 8.3 |
| सही परीक्षण | ||
| प्रति प्रयास पास दर | 68.4% | 63.2% |
| अस्थिर टेस्ट | 4 | 4 |
| कुल रन | 57 | 57 |
| प्रति परिणाम लागत | 3.609 | 7.559 |
| कुल लागत | $0.397 | $0.756 |
| ???? ??? | $1.750 / 1M | $1.250 / 1M |
| ????? ??? | $14.000 / 1M | $2.500 / 1M |
| आउटपुट टोकन | 2,731 | 1,784 |
| रीजनिंग टोकन | 22,200 | 128,233 |
| प्रतिक्रिया समय (औसत) | 15.22s | 14.53s |
| प्रतिक्रिया समय (अधिकतम) | 77.80s | 63.48s |
| प्रतिक्रिया समय (कुल) | 182.59s | 276.06s |
स्कोर बनाम कुल लागत
प्रतिक्रिया समय (औसत)
स्कोर vs प्रतिक्रिया समय (औसत)
कुल आउटपुट टोकन
स्कोर vs कुल आउटपुट टोकन
श्रेणी विवरण
त्वरित तुलना
तुलना जोड़ी बदलें
DeepSeek V4 ProhighvsGrok 4.20mediumGemma 4 31Bnoneनिःशुल्क उपलब्धvsGrok 4.20mediumClaude Sonnet 4.6nonevsGPT-5.2mediumRing 2.6 1tnoneनिःशुल्क उपलब्धvsGPT-5.2mediumGemini 3.1 Flash LiteminimalvsGrok 4.20mediumGPT-5.2mediumvsQwen3.6 Max PreviewnoneGPT-5.5nonevsGrok 4.20mediumGemini 3.1 Flash LitenonevsGrok 4.20mediumQwen3.5 Plus 2026-02-15nonevsGrok 4.20mediumClaude Sonnet 4.6nonevsGrok 4.20mediumGemma 4 31Bnoneनिःशुल्क उपलब्धvsGPT-5.2mediumDeepSeek V4 FlashhighvsGPT-5.2medium