AI BENCHY Compare
OpenAI: GPT-5.4 vs OpenAI: GPT-5.5
AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-24
| मेट्रिक | GPT-5.4 GPT-5.4 medium | GPT-5.5 GPT-5.5 medium |
|---|---|---|
| स्कोअर | 8.2 | 9.0 |
| क्रमांक | #18 | #5 |
| विश्वसनीयता | लागू नाही | लागू नाही |
| सुसंगतता | 8.7 | 9.2 |
| बरोबर चाचण्या | ||
| प्रति प्रयत्न पास दर | 79.6% | 87.0% |
| अस्थिर चाचण्या | 3 | 2 |
| एकूण रन | 54 | 54 |
| प्रति निकाल खर्च | 6.399 | 19.226 |
| एकूण खर्च | $0.832 | $2.884 |
| ???? ??? | $2.500 / 1M | $5.000 / 1M |
| ????? ??? | $15.000 / 1M | $30.000 / 1M |
| आउटपुट टोकन्स | 2,169 | 1,920 |
| रिझनिंग टोकन्स | 48,732 | 89,632 |
| प्रतिसाद वेळ (सरासरी) | 18.63s | 32.75s |
| प्रतिसाद वेळ (कमाल) | 100.41s | 332.10s |
| प्रतिसाद वेळ (एकूण) | 335.26s | 589.59s |
स्कोअर विरुद्ध एकूण खर्च
प्रतिसाद वेळ (सरासरी)
स्कोअर vs प्रतिसाद वेळ (सरासरी)
एकूण आउटपुट टोकन्स
स्कोअर vs एकूण आउटपुट टोकन्स
श्रेणीवार तपशील
झटपट तुलना
तुलना जोडी बदला
GPT-5.4mediumvsHY3 Previewlowमोफत उपलब्धGemini 3 Flash PreviewnonevsGPT-5.4mediumGemini 3.1 Flash Lite PreviewlowvsGPT-5.4mediumGemini 3 Flash PreviewlowvsGPT-5.5mediumClaude Opus 4.7nonevsGPT-5.5mediumGPT-5.4mediumvsHY3 Previewhighमोफत उपलब्धGemini 3.1 Flash Lite PreviewnonevsGPT-5.4mediumDeepSeek V4 FlashhighvsGPT-5.4mediumGPT-5.5mediumvsHY3 Previewhighमोफत उपलब्धGemini 3 Flash PreviewlowvsGPT-5.4mediumClaude Sonnet 4.6nonevsGPT-5.4mediumGPT-5.5mediumvsHY3 Previewlowमोफत उपलब्ध