#14
GPT-5.3 Chat
OpenAI · الإصدار: 2026-03-03 · openai/gpt-5.3-chat::none
متوسط الدرجة
7.27
التكلفة لكل نتيجة
2.835
الاتساق
8.27
إجمالي التكلفة
$0.256
اختبارات صحيحة
9
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.
الاختبارات الخاطئة
5
معدل النجاح لكل محاولة: 73.8%
اختبارات غير مستقرة
3
زمن الاستجابة: المتوسط 5.81s · الإجمالي 81.36s · الحد الأقصى 18.33s
إجابة خاطئة: 3
لم يتبع التعليمات: 2
أفضل النماذج حسب الدرجة
اختر النموذج الأول، ثم انقر على نموذج ثانٍ لفتح صفحة مقارنة جنبًا إلى جنب.
مقارنة سريعة
GPT-5.3 ChatnonevsGLM 5mediumGPT-5.3 ChatnonevsGemini 3 Flash PreviewnoneGPT-5.3 ChatnonevsGPT-5.2 ChatnoneGPT-5.3 ChatnonevsGemini 2.5 FlashmediumGPT-5.3 ChatnonevsClaude Sonnet 4.6mediumGPT-5.3 ChatnonevsStep 3.5 Flashmediumمتاح مجانًاGPT-5.3 ChatnonevsGemini 3 Flash PreviewmediumGPT-5.3 ChatnonevsGemini 3.1 Pro Previewmedium
تفصيل الفئات
| الفئة | متوسط الدرجة | الاتساق | اختبارات صحيحة |
|---|---|---|---|
| Anti-AI Tricks | 7.34 | 7.50 | 2/3 |
| Data parsing and extraction | 9.88 | 10.00 | 2/2 |
| Domain specific | 1.00 | 4.42 | 0/3 |
| Instructions following | 8.50 | 9.99 | 1/2 |
| Puzzle Solving | 10.00 | 10.00 | 3/3 |
| Tool Calling | 10.00 | 10.00 | 1/1 |