AI BENCHY तुलना
OpenAI: GPT-5.5 vs xAI: Grok 4.3
बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-01
| मेट्रिक | GPT-5.5 GPT-5.5 low | Grok 4.3 Grok 4.3 medium |
|---|---|---|
| स्कोर | 9.0 | 8.2 |
| रैंक | #5 | #20 |
| विश्वसनीयता | 10.0 | 10.0 |
| संगति | 9.6 | 8.6 |
| सही परीक्षण | ||
| प्रति प्रयास पास दर | 87.0% | 81.5% |
| अस्थिर टेस्ट | 1 | 3 |
| कुल रन | 54 | 54 |
| प्रति परिणाम लागत | 4.534 | 3.974 |
| कुल लागत | $0.681 | $0.517 |
| ???? ??? | $5.000 / 1M | $1.250 / 1M |
| ????? ??? | $30.000 / 1M | $2.500 / 1M |
| आउटपुट टोकन | 1,959 | 1,223 |
| रीजनिंग टोकन | 16,134 | 187,047 |
| प्रतिक्रिया समय (औसत) | 8.39s | 48.63s |
| प्रतिक्रिया समय (अधिकतम) | 56.19s | 216.69s |
| प्रतिक्रिया समय (कुल) | 151.01s | 875.27s |
स्कोर बनाम कुल लागत
प्रतिक्रिया समय (औसत)
स्कोर vs प्रतिक्रिया समय (औसत)
कुल आउटपुट टोकन
स्कोर vs कुल आउटपुट टोकन
श्रेणी विवरण
त्वरित तुलना
तुलना जोड़ी बदलें
HY3 Previewlowनिःशुल्क उपलब्धvsGrok 4.3mediumGemini 3 Flash PreviewnonevsGrok 4.3mediumGemini 3.1 Flash Lite PreviewlowvsGrok 4.3mediumClaude Opus 4.7nonevsGPT-5.5lowClaude Opus 4.7mediumvsGPT-5.5lowGPT-5.5lowvsQwen3.6 Max PreviewmediumGPT-5.5lowvsQwen3.6 35B A3BmediumGPT-5.2 ChatnonevsGrok 4.3mediumGemini 3.1 Flash Lite PreviewnonevsGrok 4.3mediumGPT-5.3 ChatnonevsGrok 4.3mediumGPT-5.5lowvsHY3 Previewhighनिःशुल्क उपलब्धHY3 Previewhighनिःशुल्क उपलब्धvsGrok 4.3medium