ترتيب إخفاقات انتهت المهلة

اكتشف أي نماذج الذكاء الاصطناعي تواجه انتهت المهلة أكثر من غيرها، حتى ترى مخاطر الاعتمادية قبل الاختيار. الترتيب حسب: اختبارات صحيحة ↓.

النماذج المعروضة

إجمالي الإخفاقات

النموذج الأكثر تأثرًا

Claude Opus 4.7 1

الفئات

ضمن الفئة خاص بالمجال43 ضمن الفئة البرمجة26 ضمن الفئة حل الألغاز5 ضمن الفئة مجمّع5 ضمن الفئة الذكاء العام4 ضمن الفئة حيل مضادة للذكاء الاصطناعي4 ضمن الفئة اتباع التعليمات1 ضمن الفئة تحليل البيانات واستخراجها1

44/44

الترتيب	النموذج	الشركة	عدد انتهت المهلة	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#15	Claude Opus 4.7 medium	Anthropic	1	8.7	$1.477	18/22	7.61s
إجمالي الاختبارات 22 الاختبارات الخاطئة 4 إجمالي التكلفة $1.477 زمن الاستجابة (المتوسط) 7.61s
#19	Qwen3.6 Max Preview medium	Qwen	1	8.4	$1.143	16/22	67.5s
إجمالي الاختبارات 22 الاختبارات الخاطئة 6 إجمالي التكلفة $1.143 زمن الاستجابة (المتوسط) 67.5s
#33	Kimi K3 max	Moonshot AI	2	8.0	$3.112	16/22	122.5s
إجمالي الاختبارات 22 الاختبارات الخاطئة 6 إجمالي التكلفة $3.112 زمن الاستجابة (المتوسط) 122.5s
#38	GLM 5.2 medium	Z.ai	1	7.8	$0.222	15/21	23.3s
إجمالي الاختبارات 21 الاختبارات الخاطئة 6 إجمالي التكلفة $0.222 زمن الاستجابة (المتوسط) 23.3s
#42	GLM 5 medium	Z.ai	1	7.7	$0.307	15/21	33.5s
إجمالي الاختبارات 21 الاختبارات الخاطئة 6 إجمالي التكلفة $0.307 زمن الاستجابة (المتوسط) 33.5s
#36	Qwen3.7 Plus medium	Qwen	1	7.9	$0.267	15/22	51.5s
إجمالي الاختبارات 22 الاختبارات الخاطئة 7 إجمالي التكلفة $0.267 زمن الاستجابة (المتوسط) 51.5s
#49	GLM 5 Turbo medium	Z.ai	1	7.6	$0.323	14/21	23.0s
إجمالي الاختبارات 21 الاختبارات الخاطئة 7 إجمالي التكلفة $0.323 زمن الاستجابة (المتوسط) 23.0s
#21	GPT-5.2 medium	OpenAI	1	8.4	$0.951	14/22	22.6s
إجمالي الاختبارات 22 الاختبارات الخاطئة 8 إجمالي التكلفة $0.951 زمن الاستجابة (المتوسط) 22.6s
#31	GLM 5.2 high	Z.ai	3	8.0	$0.970	14/22	62.7s
إجمالي الاختبارات 22 الاختبارات الخاطئة 8 إجمالي التكلفة $0.970 زمن الاستجابة (المتوسط) 62.7s
#40	Claude Sonnet 4.6 medium	Anthropic	1	7.8	$2.057	14/22	25.9s
إجمالي الاختبارات 22 الاختبارات الخاطئة 8 إجمالي التكلفة $2.057 زمن الاستجابة (المتوسط) 25.9s
#57	Qwen3.5 Plus 2026-02-15 medium	Qwen	2	7.5	$0.437	14/22	89.2s
إجمالي الاختبارات 22 الاختبارات الخاطئة 8 إجمالي التكلفة $0.437 زمن الاستجابة (المتوسط) 89.2s
#72	Qwen3.5-122B-A10B medium	Qwen	2	7.1	$1.046	14/22	64.2s
إجمالي الاختبارات 22 الاختبارات الخاطئة 8 إجمالي التكلفة $1.046 زمن الاستجابة (المتوسط) 64.2s
#95	Gemma 4 26B A4B medium	Google	2	6.6	$0.089	14/22	103.8s
إجمالي الاختبارات 22 الاختبارات الخاطئة 8 إجمالي التكلفة $0.089 زمن الاستجابة (المتوسط) 103.8s
#110	Gemma 4 31B medium	Google	2	6.3	$0.163	14/22	75.4s
إجمالي الاختبارات 22 الاختبارات الخاطئة 8 إجمالي التكلفة $0.163 زمن الاستجابة (المتوسط) 75.4s
#58	Qwen3.5-27B medium	Qwen	1	7.4	$1.627	13/22	111.9s
إجمالي الاختبارات 22 الاختبارات الخاطئة 9 إجمالي التكلفة $1.627 زمن الاستجابة (المتوسط) 111.9s

إخفاقات انتهت المهلة

تصفية النماذج

أفضل النماذج حسب عدد انتهت المهلة

عدد انتهت المهلة مقابل النتيجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)