AI BENCHY Compare
OpenAI: GPT-5.5 vs xAI: Grok 4.3
AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-01
| मेट्रिक | GPT-5.5 GPT-5.5 low | Grok 4.3 Grok 4.3 medium |
|---|---|---|
| स्कोअर | 9.0 | 8.2 |
| क्रमांक | #5 | #20 |
| विश्वसनीयता | 10.0 | 10.0 |
| सुसंगतता | 9.6 | 8.6 |
| बरोबर चाचण्या | ||
| प्रति प्रयत्न पास दर | 87.0% | 81.5% |
| अस्थिर चाचण्या | 1 | 3 |
| एकूण रन | 54 | 54 |
| प्रति निकाल खर्च | 4.534 | 3.974 |
| एकूण खर्च | $0.681 | $0.517 |
| ???? ??? | $5.000 / 1M | $1.250 / 1M |
| ????? ??? | $30.000 / 1M | $2.500 / 1M |
| आउटपुट टोकन्स | 1,959 | 1,223 |
| रिझनिंग टोकन्स | 16,134 | 187,047 |
| प्रतिसाद वेळ (सरासरी) | 8.39s | 48.63s |
| प्रतिसाद वेळ (कमाल) | 56.19s | 216.69s |
| प्रतिसाद वेळ (एकूण) | 151.01s | 875.27s |
स्कोअर विरुद्ध एकूण खर्च
प्रतिसाद वेळ (सरासरी)
स्कोअर vs प्रतिसाद वेळ (सरासरी)
एकूण आउटपुट टोकन्स
स्कोअर vs एकूण आउटपुट टोकन्स
श्रेणीवार तपशील
झटपट तुलना
तुलना जोडी बदला
HY3 Previewlowमोफत उपलब्धvsGrok 4.3mediumGemini 3 Flash PreviewnonevsGrok 4.3mediumGemini 3.1 Flash Lite PreviewlowvsGrok 4.3mediumClaude Opus 4.7nonevsGPT-5.5lowClaude Opus 4.7mediumvsGPT-5.5lowGPT-5.5lowvsQwen3.6 Max PreviewmediumGPT-5.5lowvsQwen3.6 35B A3BmediumGPT-5.2 ChatnonevsGrok 4.3mediumGemini 3.1 Flash Lite PreviewnonevsGrok 4.3mediumGPT-5.3 ChatnonevsGrok 4.3mediumGPT-5.5lowvsHY3 Previewhighमोफत उपलब्धHY3 Previewhighमोफत उपलब्धvsGrok 4.3medium