AI BENCHY Compare
OpenAI: GPT-5.4 vs xAI: Grok 4.20
AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-10
| मेट्रिक | GPT-5.4 GPT-5.4 none | Grok 4.20 Grok 4.20 none |
|---|---|---|
| स्कोअर | 5.7 | 5.4 |
| क्रमांक | #100 | #115 |
| विश्वसनीयता | 10.0 | लागू नाही |
| सुसंगतता | 9.1 | 9.5 |
| बरोबर चाचण्या | ||
| प्रति प्रयत्न पास दर | 40.4% | 35.2% |
| अस्थिर चाचण्या | 2 | 1 |
| एकूण रन | 57 | 54 |
| प्रति निकाल खर्च | 1.493 | 1.574 |
| एकूण खर्च | $0.105 | $0.095 |
| ???? ??? | $2.500 / 1M | $1.250 / 1M |
| ????? ??? | $15.000 / 1M | $2.500 / 1M |
| आउटपुट टोकन्स | 2,357 | 1,967 |
| रिझनिंग टोकन्स | 0 | 0 |
| प्रतिसाद वेळ (सरासरी) | 1.48s | 1.11s |
| प्रतिसाद वेळ (कमाल) | 2.95s | 6.04s |
| प्रतिसाद वेळ (एकूण) | 28.20s | 20.02s |
स्कोअर विरुद्ध एकूण खर्च
प्रतिसाद वेळ (सरासरी)
स्कोअर vs प्रतिसाद वेळ (सरासरी)
एकूण आउटपुट टोकन्स
स्कोअर vs एकूण आउटपुट टोकन्स
श्रेणीवार तपशील
झटपट तुलना
तुलना जोडी बदला
Elephant AlphamediumvsGrok 4.20noneCobuddymediumमोफत उपलब्धvsGPT-5.4noneMistral Small 4mediumvsGrok 4.20noneMiniMax M2.5mediumमोफत उपलब्धvsGrok 4.20noneMiniMax M2.5mediumमोफत उपलब्धvsGPT-5.4noneMistral Small 4mediumvsGPT-5.4noneGPT-5.4nonevsElephant AlphamediumGPT-5.4nonevsOwl AlphamediumMiniMax M2.7mediumvsGrok 4.20nonegpt-oss-120bmediumमोफत उपलब्धvsGrok 4.20noneNemotron 3 Supermediumमोफत उपलब्धvsGPT-5.4noneCobuddymediumमोफत उपलब्धvsGrok 4.20none