ترتيب إخفاقات انتهت المهلة

اكتشف أي نماذج الذكاء الاصطناعي تواجه انتهت المهلة أكثر من غيرها، حتى ترى مخاطر الاعتمادية قبل الاختيار. الترتيب حسب: النتيجة ↑.

النماذج المعروضة

إجمالي الإخفاقات

النموذج الأكثر تأثرًا

Qwen3.5-9B 12

الفئات

ضمن الفئة خاص بالمجال43 ضمن الفئة البرمجة26 ضمن الفئة حل الألغاز5 ضمن الفئة مجمّع5 ضمن الفئة الذكاء العام4 ضمن الفئة حيل مضادة للذكاء الاصطناعي4 ضمن الفئة اتباع التعليمات1 ضمن الفئة تحليل البيانات واستخراجها1

44/44

الترتيب	النموذج	الشركة	عدد انتهت المهلة	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#52	Kimi K2.7 Code medium	Moonshot AI	3	7.5	$0.751	12/22	84.2s
إجمالي الاختبارات 22 الاختبارات الخاطئة 10 إجمالي التكلفة $0.751 زمن الاستجابة (المتوسط) 84.2s
#49	GLM 5 Turbo medium	Z.ai	1	7.6	$0.323	14/21	23.0s
إجمالي الاختبارات 21 الاختبارات الخاطئة 7 إجمالي التكلفة $0.323 زمن الاستجابة (المتوسط) 23.0s
#47	MiniMax M3 medium	Minimax	3	7.6	$0.286	12/22	75.0s
إجمالي الاختبارات 22 الاختبارات الخاطئة 10 إجمالي التكلفة $0.286 زمن الاستجابة (المتوسط) 75.0s
#46	DeepSeek V4 Pro high	DeepSeek	1	7.7	$0.200	10/22	79.1s
إجمالي الاختبارات 22 الاختبارات الخاطئة 12 إجمالي التكلفة $0.200 زمن الاستجابة (المتوسط) 79.1s
#42	GLM 5 medium	Z.ai	1	7.7	$0.307	15/21	33.5s
إجمالي الاختبارات 21 الاختبارات الخاطئة 6 إجمالي التكلفة $0.307 زمن الاستجابة (المتوسط) 33.5s
#40	Claude Sonnet 4.6 medium	Anthropic	1	7.8	$2.057	14/22	25.9s
إجمالي الاختبارات 22 الاختبارات الخاطئة 8 إجمالي التكلفة $2.057 زمن الاستجابة (المتوسط) 25.9s
#38	GLM 5.2 medium	Z.ai	1	7.8	$0.222	15/21	23.3s
إجمالي الاختبارات 21 الاختبارات الخاطئة 6 إجمالي التكلفة $0.222 زمن الاستجابة (المتوسط) 23.3s
#36	Qwen3.7 Plus medium	Qwen	1	7.9	$0.267	15/22	51.5s
إجمالي الاختبارات 22 الاختبارات الخاطئة 7 إجمالي التكلفة $0.267 زمن الاستجابة (المتوسط) 51.5s
#33	Kimi K3 max	Moonshot AI	2	8.0	$3.112	16/22	122.5s
إجمالي الاختبارات 22 الاختبارات الخاطئة 6 إجمالي التكلفة $3.112 زمن الاستجابة (المتوسط) 122.5s
#31	GLM 5.2 high	Z.ai	3	8.0	$0.970	14/22	62.7s
إجمالي الاختبارات 22 الاختبارات الخاطئة 8 إجمالي التكلفة $0.970 زمن الاستجابة (المتوسط) 62.7s
#26	GPT-5 Mini medium	OpenAI	1	8.1	$0.237	12/22	27.6s
إجمالي الاختبارات 22 الاختبارات الخاطئة 10 إجمالي التكلفة $0.237 زمن الاستجابة (المتوسط) 27.6s
#21	GPT-5.2 medium	OpenAI	1	8.4	$0.951	14/22	22.6s
إجمالي الاختبارات 22 الاختبارات الخاطئة 8 إجمالي التكلفة $0.951 زمن الاستجابة (المتوسط) 22.6s
#19	Qwen3.6 Max Preview medium	Qwen	1	8.4	$1.143	16/22	67.5s
إجمالي الاختبارات 22 الاختبارات الخاطئة 6 إجمالي التكلفة $1.143 زمن الاستجابة (المتوسط) 67.5s
#15	Claude Opus 4.7 medium	Anthropic	1	8.7	$1.477	18/22	7.61s
إجمالي الاختبارات 22 الاختبارات الخاطئة 4 إجمالي التكلفة $1.477 زمن الاستجابة (المتوسط) 7.61s

إخفاقات انتهت المهلة

تصفية النماذج

أفضل النماذج حسب عدد انتهت المهلة

عدد انتهت المهلة مقابل النتيجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)