ترتيب إخفاقات انتهت المهلة

اكتشف أي نماذج الذكاء الاصطناعي تواجه انتهت المهلة أكثر من غيرها، حتى ترى مخاطر الاعتمادية قبل الاختيار. الترتيب حسب: النتيجة ↓.

النماذج المعروضة

إجمالي الإخفاقات

النموذج الأكثر تأثرًا

Claude Opus 4.7 1

الفئات

ضمن الفئة خاص بالمجال43 ضمن الفئة البرمجة26 ضمن الفئة حل الألغاز5 ضمن الفئة مجمّع5 ضمن الفئة الذكاء العام4 ضمن الفئة حيل مضادة للذكاء الاصطناعي4 ضمن الفئة اتباع التعليمات1 ضمن الفئة تحليل البيانات واستخراجها1

44/44

الترتيب	النموذج	الشركة	عدد انتهت المهلة	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#58	Qwen3.5-27B medium	Qwen	1	7.4	$1.627	13/22	111.9s
إجمالي الاختبارات 22 الاختبارات الخاطئة 9 إجمالي التكلفة $1.627 زمن الاستجابة (المتوسط) 111.9s
#60	LongCat 2.0 medium	Meituan	1	7.4	$0.478	12/22	136.6s
إجمالي الاختبارات 22 الاختبارات الخاطئة 10 إجمالي التكلفة $0.478 زمن الاستجابة (المتوسط) 136.6s
#68	Kimi K2.6 medium	Moonshot AI	3	7.2	$1.036	12/22	110.0s
إجمالي الاختبارات 22 الاختبارات الخاطئة 10 إجمالي التكلفة $1.036 زمن الاستجابة (المتوسط) 110.0s
#70	Qwen3.5 Plus 2026-04-20 medium	Qwen	1	7.2	$0.317	13/22	46.4s
إجمالي الاختبارات 22 الاختبارات الخاطئة 9 إجمالي التكلفة $0.317 زمن الاستجابة (المتوسط) 46.4s
#72	Qwen3.5-122B-A10B medium	Qwen	2	7.1	$1.046	14/22	64.2s
إجمالي الاختبارات 22 الاختبارات الخاطئة 8 إجمالي التكلفة $1.046 زمن الاستجابة (المتوسط) 64.2s
#74	GLM 5.1 medium	Z.ai	2	7.1	$0.535	13/22	46.8s
إجمالي الاختبارات 22 الاختبارات الخاطئة 9 إجمالي التكلفة $0.535 زمن الاستجابة (المتوسط) 46.8s
#76	DeepSeek V3.2 medium	DeepSeek	2	7.0	$0.078	11/22	68.6s
إجمالي الاختبارات 22 الاختبارات الخاطئة 11 إجمالي التكلفة $0.078 زمن الاستجابة (المتوسط) 68.6s
#77	Kimi K2.5 medium	Moonshot AI	2	7.0	$0.600	10/22	99.0s
إجمالي الاختبارات 22 الاختبارات الخاطئة 12 إجمالي التكلفة $0.600 زمن الاستجابة (المتوسط) 99.0s
#80	Seed-2.0-Mini medium	Bytedance Seed	5	7.0	$0.101	11/22	92.5s
إجمالي الاختبارات 22 الاختبارات الخاطئة 11 إجمالي التكلفة $0.101 زمن الاستجابة (المتوسط) 92.5s
#91	LongCat 2.0 low	Meituan	1	6.7	$0.391	10/22	100.3s
إجمالي الاختبارات 22 الاختبارات الخاطئة 12 إجمالي التكلفة $0.391 زمن الاستجابة (المتوسط) 100.3s
#95	Gemma 4 26B A4B medium	Google	2	6.6	$0.089	14/22	103.8s
إجمالي الاختبارات 22 الاختبارات الخاطئة 8 إجمالي التكلفة $0.089 زمن الاستجابة (المتوسط) 103.8s
#97	LongCat 2.0 high	Meituan	3	6.6	$0.469	9/22	148.7s
إجمالي الاختبارات 22 الاختبارات الخاطئة 13 إجمالي التكلفة $0.469 زمن الاستجابة (المتوسط) 148.7s
#109	Mimo V2 PRO medium	Xiaomi	1	6.3	$0.333	12/21	22.2s
إجمالي الاختبارات 21 الاختبارات الخاطئة 9 إجمالي التكلفة $0.333 زمن الاستجابة (المتوسط) 22.2s
#110	Gemma 4 31B medium	Google	2	6.3	$0.163	14/22	75.4s
إجمالي الاختبارات 22 الاختبارات الخاطئة 8 إجمالي التكلفة $0.163 زمن الاستجابة (المتوسط) 75.4s
#113	MiMo-V2-Flash medium	Xiaomi	1	6.3	$0.043	12/21	20.1s
إجمالي الاختبارات 21 الاختبارات الخاطئة 9 إجمالي التكلفة $0.043 زمن الاستجابة (المتوسط) 20.1s

إخفاقات انتهت المهلة

تصفية النماذج

أفضل النماذج حسب عدد انتهت المهلة

عدد انتهت المهلة مقابل النتيجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)