ترتيب خاص بالمجال x انتهت المهلة

اكتشف أي نماذج الذكاء الاصطناعي هي الأكثر عرضة لظهور انتهت المهلة في خاص بالمجال، حتى ترصد نقاط الضعف بسرعة أكبر. الترتيب حسب: اختبارات صحيحة ↓.

النماذج المعروضة

إجمالي الإخفاقات

النموذج الأكثر تأثرًا

Claude Opus 4.7 1

أسباب الفشل

إجابة خاطئة412 انتهت المهلة43 تنسيق إضافي17 لا توجد إجابة8 خطأ API7 لم يتبع التعليمات1

الفئات

خاص بالمجال43 البرمجة26 حل الألغاز5 مجمّع5 الذكاء العام4 حيل مضادة للذكاء الاصطناعي4 اتباع التعليمات1 تحليل البيانات واستخراجها1

32/32

الترتيب	النموذج	الشركة	عدد انتهت المهلة	درجة الفئة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#15	Claude Opus 4.7 medium	Anthropic	1	7.7	$1.477	2/3	1.17s
إجمالي الاختبارات 3 الاختبارات الخاطئة 1 إجمالي التكلفة $1.477 زمن الاستجابة (المتوسط) 1.17s
#21	GPT-5.2 medium	OpenAI	1	5.9	$0.951	1/3	77.8s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.951 زمن الاستجابة (المتوسط) 77.8s
#33	Kimi K3 max	Moonshot AI	2	5.9	$3.112	1/3	490.1s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $3.112 زمن الاستجابة (المتوسط) 490.1s
#47	MiniMax M3 medium	Minimax	2	5.5	$0.286	1/3	233.1s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.286 زمن الاستجابة (المتوسط) 233.1s
#52	Kimi K2.7 Code medium	Moonshot AI	2	5.5	$0.751	1/3	213.3s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.751 زمن الاستجابة (المتوسط) 213.3s
#57	Qwen3.5 Plus 2026-02-15 medium	Qwen	1	5.3	$0.437	1/3	17.5s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.437 زمن الاستجابة (المتوسط) 17.5s
#58	Qwen3.5-27B medium	Qwen	1	5.3	$1.627	1/3	79.5s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $1.627 زمن الاستجابة (المتوسط) 79.5s
#68	Kimi K2.6 medium	Moonshot AI	2	5.3	$1.036	1/3	202.4s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $1.036 زمن الاستجابة (المتوسط) 202.4s
#74	GLM 5.1 medium	Z.ai	1	5.3	$0.535	1/3	29.8s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.535 زمن الاستجابة (المتوسط) 29.8s
#109	Mimo V2 PRO medium	Xiaomi	1	5.3	$0.333	1/3	8.82s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.333 زمن الاستجابة (المتوسط) 8.82s
#114	Qwen3.5-Flash medium	Qwen	1	5.3	$0.139	1/3	146.5s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.139 زمن الاستجابة (المتوسط) 146.5s
#128	GPT-5 Nano medium	OpenAI	1	5.2	$0.114	1/3	204.0s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.114 زمن الاستجابة (المتوسط) 204.0s
#185	Grok 4.1 Fast medium	X AI	1	5.8	$0.069	1/3	121.8s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.069 زمن الاستجابة (المتوسط) 121.8s
#26	GPT-5 Mini medium	OpenAI	1	3.6	$0.237	0/3	44.6s
إجمالي الاختبارات 3 الاختبارات الخاطئة 3 إجمالي التكلفة $0.237 زمن الاستجابة (المتوسط) 44.6s
#31	GLM 5.2 high	Z.ai	1	3.7	$0.970	0/3	74.0s
إجمالي الاختبارات 3 الاختبارات الخاطئة 3 إجمالي التكلفة $0.970 زمن الاستجابة (المتوسط) 74.0s

تصفية النماذج

أفضل النماذج حسب عدد انتهت المهلة

عدد انتهت المهلة مقابل النتيجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)

أفضل النماذج حسب التكلفة المهدرة التقديرية

خاص بالمجال: انتهت المهلة

تصفية النماذج

أفضل النماذج حسب عدد انتهت المهلة

عدد انتهت المهلة مقابل النتيجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)

أفضل النماذج حسب التكلفة المهدرة التقديرية