#33

GPT-5 Mini

OpenAI · الإصدار: 2025-08-07 · openai/gpt-5-mini::medium

متوسط الدرجة

5.77

التكلفة لكل نتيجة

1.200

الاتساق

8.80

إجمالي التكلفة

$0.084

اختبارات صحيحة

7

يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.

الاختبارات الخاطئة

7

معدل النجاح لكل محاولة: 57.1%

اختبارات غير مستقرة

2

زمن الاستجابة: المتوسط 21.47s · الإجمالي 300.64s · الحد الأقصى 82.55s

لم يتبع التعليمات: 3 إجابة خاطئة: 3 انتهت المهلة: 1

أفضل النماذج حسب الدرجة

اختر النموذج الأول، ثم انقر على نموذج ثانٍ لفتح صفحة مقارنة جنبًا إلى جنب.

#27 GLM 5 6.08

#28 Claude Opus 4.6 6.08

#29 MiMo-V2-Flash 6.00

#30 Qwen3.5-35B-A3B 5.93

#31 GPT-5 Nano 5.86

#32 Qwen3.5-Flash 5.79

#33 GPT-5 Mini 5.77

#34 gpt-oss-120b 5.65

#35 MiniMax M2.5 5.65

#36 Gemini 2.5 Flash 5.34

#37 Qwen3.5-122B-A10B 5.20

#38 GPT-4o-mini 4.86

#39 DeepSeek V3.2 4.70

الفئة	متوسط الدرجة	الاتساق	اختبارات صحيحة
Anti-AI Tricks	7.00	9.62	2/3
Data parsing and extraction	9.88	10.00	2/2
Domain specific	1.00	7.21	0/3
Instructions following	7.00	6.64	1/2
Puzzle Solving	4.34	9.78	1/3
Tool Calling	10.00	10.00	1/1