ترتيب معلومات عامة x لا توجد إجابة

اكتشف أي نماذج الذكاء الاصطناعي هي الأكثر عرضة لظهور لا توجد إجابة في معلومات عامة، حتى ترصد نقاط الضعف بسرعة أكبر.

النماذج المعروضة

إجمالي الإخفاقات

النموذج الأكثر تأثرًا

أسباب الفشل

إجابة خاطئة168 خطأ API13 لا توجد إجابة13

الفئات

مجمّع29 البرمجة18 معلومات عامة13 تحليل البيانات واستخراجها8 خاص بالمجال8 حيل مضادة للذكاء الاصطناعي4 حل الألغاز3 اتباع التعليمات2 استدعاء الأدوات2

13/13

الترتيب	النموذج	الشركة	عدد لا توجد إجابة	درجة الفئة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#12	Grok 4.5 high	X AI	1	3.0	$1.707	0/1	60.6s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $1.707 زمن الاستجابة (المتوسط) 60.6s
#14	Claude Opus 4.8 medium	Anthropic	1	3.0	$1.931	0/1	6.14s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $1.931 زمن الاستجابة (المتوسط) 6.14s
#17	Claude Fable 5 medium	Anthropic	1	3.0	$3.478	0/1	25.6s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $3.478 زمن الاستجابة (المتوسط) 25.6s
#29	Step 3.7 Flash medium	Stepfun	1	3.0	$0.515	0/1	114.0s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.515 زمن الاستجابة (المتوسط) 114.0s
#33	Kimi K3 max	Moonshot AI	1	3.0	$3.112	0/1	19.7s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $3.112 زمن الاستجابة (المتوسط) 19.7s
#38	GLM 5.2 medium	Z.ai	1	3.0	$0.222	0/1	34.2s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.222 زمن الاستجابة (المتوسط) 34.2s
#41	Claude Opus 4.8 low	Anthropic	1	3.0	$2.077	0/1	5.48s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $2.077 زمن الاستجابة (المتوسط) 5.48s
#47	MiniMax M3 medium	Minimax	1	3.0	$0.286	0/1	100.8s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.286 زمن الاستجابة (المتوسط) 100.8s
#66	Claude Opus 4.8 none	Anthropic	1	3.0	$1.166	0/1	3.41s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $1.166 زمن الاستجابة (المتوسط) 3.41s
#67	Step 3.7 Flash low	Stepfun	1	3.0	$0.454	0/1	124.8s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.454 زمن الاستجابة (المتوسط) 124.8s
#86	Step 3.7 Flash high	Stepfun	1	3.0	$1.207	0/1	149.3s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $1.207 زمن الاستجابة (المتوسط) 149.3s
#97	LongCat 2.0 high	Meituan	1	3.0	$0.469	0/1	99.4s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.469 زمن الاستجابة (المتوسط) 99.4s
#112	Claude Sonnet 5 none	Anthropic	1	3.0	$0.548	0/1	4.31s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.548 زمن الاستجابة (المتوسط) 4.31s

تصفية النماذج

أفضل النماذج حسب عدد لا توجد إجابة

عدد لا توجد إجابة مقابل النتيجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)

أفضل النماذج حسب التكلفة المهدرة التقديرية

معلومات عامة: لا توجد إجابة

تصفية النماذج

أفضل النماذج حسب عدد لا توجد إجابة

عدد لا توجد إجابة مقابل النتيجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)

أفضل النماذج حسب التكلفة المهدرة التقديرية