ترتيب إخفاقات انتهت المهلة

اكتشف أي نماذج الذكاء الاصطناعي تواجه انتهت المهلة أكثر من غيرها، حتى ترى مخاطر الاعتمادية قبل الاختيار.

النماذج المعروضة

إجمالي الإخفاقات

النموذج الأكثر تأثرًا

الفئات

ضمن الفئة خاص بالمجال43 ضمن الفئة البرمجة26 ضمن الفئة حل الألغاز5 ضمن الفئة مجمّع5 ضمن الفئة الذكاء العام4 ضمن الفئة حيل مضادة للذكاء الاصطناعي4 ضمن الفئة اتباع التعليمات1 ضمن الفئة تحليل البيانات واستخراجها1

44/44

الترتيب	النموذج	الشركة	عدد انتهت المهلة	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#77	Kimi K2.5 medium	Moonshot AI	2	7.0	$0.600	10/22	99.0s
إجمالي الاختبارات 22 الاختبارات الخاطئة 12 إجمالي التكلفة $0.600 زمن الاستجابة (المتوسط) 99.0s
#95	Gemma 4 26B A4B medium	Google	2	6.6	$0.089	14/22	103.8s
إجمالي الاختبارات 22 الاختبارات الخاطئة 8 إجمالي التكلفة $0.089 زمن الاستجابة (المتوسط) 103.8s
#110	Gemma 4 31B medium	Google	2	6.3	$0.163	14/22	75.4s
إجمالي الاختبارات 22 الاختبارات الخاطئة 8 إجمالي التكلفة $0.163 زمن الاستجابة (المتوسط) 75.4s
#172	MiniMax M2.7 medium	Minimax	2	5.0	$0.163	5/22	41.3s
إجمالي الاختبارات 22 الاختبارات الخاطئة 17 إجمالي التكلفة $0.163 زمن الاستجابة (المتوسط) 41.3s
#184	Hunter Alpha medium	OpenRouter	2	4.7	$0.000	8/18	10.3s
إجمالي الاختبارات 18 الاختبارات الخاطئة 10 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 10.3s
#194	GLM 4.7 Flash medium	Z.ai	2	4.3	$0.166	4/22	142.6s
إجمالي الاختبارات 22 الاختبارات الخاطئة 18 إجمالي التكلفة $0.166 زمن الاستجابة (المتوسط) 142.6s
#15	Claude Opus 4.7 medium	Anthropic	1	8.7	$1.477	18/22	7.61s
إجمالي الاختبارات 22 الاختبارات الخاطئة 4 إجمالي التكلفة $1.477 زمن الاستجابة (المتوسط) 7.61s
#19	Qwen3.6 Max Preview medium	Qwen	1	8.4	$1.143	16/22	67.5s
إجمالي الاختبارات 22 الاختبارات الخاطئة 6 إجمالي التكلفة $1.143 زمن الاستجابة (المتوسط) 67.5s
#21	GPT-5.2 medium	OpenAI	1	8.4	$0.951	14/22	22.6s
إجمالي الاختبارات 22 الاختبارات الخاطئة 8 إجمالي التكلفة $0.951 زمن الاستجابة (المتوسط) 22.6s
#26	GPT-5 Mini medium	OpenAI	1	8.1	$0.237	12/22	27.6s
إجمالي الاختبارات 22 الاختبارات الخاطئة 10 إجمالي التكلفة $0.237 زمن الاستجابة (المتوسط) 27.6s
#36	Qwen3.7 Plus medium	Qwen	1	7.9	$0.267	15/22	51.5s
إجمالي الاختبارات 22 الاختبارات الخاطئة 7 إجمالي التكلفة $0.267 زمن الاستجابة (المتوسط) 51.5s
#38	GLM 5.2 medium	Z.ai	1	7.8	$0.222	15/21	23.3s
إجمالي الاختبارات 21 الاختبارات الخاطئة 6 إجمالي التكلفة $0.222 زمن الاستجابة (المتوسط) 23.3s
#40	Claude Sonnet 4.6 medium	Anthropic	1	7.8	$2.057	14/22	25.9s
إجمالي الاختبارات 22 الاختبارات الخاطئة 8 إجمالي التكلفة $2.057 زمن الاستجابة (المتوسط) 25.9s
#42	GLM 5 medium	Z.ai	1	7.7	$0.307	15/21	33.5s
إجمالي الاختبارات 21 الاختبارات الخاطئة 6 إجمالي التكلفة $0.307 زمن الاستجابة (المتوسط) 33.5s
#46	DeepSeek V4 Pro high	DeepSeek	1	7.7	$0.200	10/22	79.1s
إجمالي الاختبارات 22 الاختبارات الخاطئة 12 إجمالي التكلفة $0.200 زمن الاستجابة (المتوسط) 79.1s

إخفاقات انتهت المهلة

تصفية النماذج

أفضل النماذج حسب عدد انتهت المهلة

عدد انتهت المهلة مقابل النتيجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)