#44

GPT-5.4

OpenAI · الإصدار: 2026-03-05 · openai/gpt-5.4::none

متوسط الدرجة

46

التكلفة لكل نتيجة

1.496

الاتساق

89

إجمالي التكلفة

$0.090

اختبارات صحيحة

6

يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.

الاختبارات الخاطئة

9

معدل النجاح لكل محاولة: 44.4%

اختبارات غير مستقرة

2

زمن الاستجابة: المتوسط 1.46s · الإجمالي 21.86s · الحد الأقصى 2.89s

إجابة خاطئة: 8 لم يتبع التعليمات: 1

أفضل النماذج حسب الدرجة

اختر النموذج الأول، ثم انقر على نموذج ثانٍ لفتح صفحة مقارنة جنبًا إلى جنب.

#38 DeepSeek V3.2 52

#39 Qwen3.5-122B-A10B 51

#40 Qwen3.5-Flash 49

#41 Qwen3.5-27B 49

#42 MiniMax M2.5 48

#43 Qwen3.5-35B-A3B 47

#44 GPT-5.4 46

#45 Trinity Large Preview (free) 43

#46 GPT-4o-mini 41

#47 GLM 4.7 Flash 39

#48 Kimi K2.5 37

#49 Qwen3 Coder Next 36

#50 Mercury 2 34

الفئة	متوسط الدرجة	الاتساق	اختبارات صحيحة
Anti-AI Tricks	100	73	0/3
Combined	100	100	0/1
Data parsing and extraction	99	100	2/2
Domain specific	40	72	1/3
Instructions following	55	100	1/2
Puzzle Solving	40	98	1/3
Tool Calling	100	100	1/1