ترتيب إخفاقات لا توجد إجابة

اكتشف أي نماذج الذكاء الاصطناعي تواجه لا توجد إجابة أكثر من غيرها، حتى ترى مخاطر الاعتمادية قبل الاختيار. الترتيب حسب: زمن الاستجابة (المتوسط) ↑.

النماذج المعروضة

إجمالي الإخفاقات

النموذج الأكثر تأثرًا

Gemini 3.1 Flash Lite Preview 1

الفئات

ضمن الفئة مجمّع29 ضمن الفئة البرمجة18 ضمن الفئة معلومات عامة13 ضمن الفئة تحليل البيانات واستخراجها8 ضمن الفئة خاص بالمجال8 ضمن الفئة حيل مضادة للذكاء الاصطناعي4 ضمن الفئة حل الألغاز3 ضمن الفئة اتباع التعليمات2 ضمن الفئة استدعاء الأدوات2

67/67

الترتيب	النموذج	الشركة	عدد لا توجد إجابة	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#30	GPT-5.2 Chat none	OpenAI	1	8.0	$0.604	14/22	7.65s
إجمالي الاختبارات 22 الاختبارات الخاطئة 8 إجمالي التكلفة $0.604 زمن الاستجابة (المتوسط) 7.65s
#166	Qwen3 Coder Next none	Qwen	1	5.1	$0.025	5/22	9.12s
إجمالي الاختبارات 22 الاختبارات الخاطئة 17 إجمالي التكلفة $0.025 زمن الاستجابة (المتوسط) 9.12s
#187	Qwen3 Coder Next medium	Qwen	1	4.7	$0.032	4/22	9.61s
إجمالي الاختبارات 22 الاختبارات الخاطئة 18 إجمالي التكلفة $0.032 زمن الاستجابة (المتوسط) 9.61s
#167	Mistral Small 4 medium	Mistral	1	5.1	$0.096	5/22	10.8s
إجمالي الاختبارات 22 الاختبارات الخاطئة 17 إجمالي التكلفة $0.096 زمن الاستجابة (المتوسط) 10.8s
#14	Claude Opus 4.8 medium	Anthropic	1	8.8	$1.931	18/22	12.5s
إجمالي الاختبارات 22 الاختبارات الخاطئة 4 إجمالي التكلفة $1.931 زمن الاستجابة (المتوسط) 12.5s
#41	Claude Opus 4.8 low	Anthropic	1	7.8	$2.077	16/22	12.7s
إجمالي الاختبارات 22 الاختبارات الخاطئة 6 إجمالي التكلفة $2.077 زمن الاستجابة (المتوسط) 12.7s
#186	Laguna M.1 medium	Poolside	1	4.7	$0.033	9/19	14.7s
إجمالي الاختبارات 19 الاختبارات الخاطئة 10 إجمالي التكلفة $0.033 زمن الاستجابة (المتوسط) 14.7s
#32	Inkling medium	Thinkingmachines	1	8.0	$0.391	15/22	16.2s
إجمالي الاختبارات 22 الاختبارات الخاطئة 7 إجمالي التكلفة $0.391 زمن الاستجابة (المتوسط) 16.2s
#207	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	1	3.4	$0.000	4/19	17.1s
إجمالي الاختبارات 19 الاختبارات الخاطئة 15 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 17.1s
#17	Claude Fable 5 medium	Anthropic	2	8.6	$3.478	17/22	17.2s
إجمالي الاختبارات 22 الاختبارات الخاطئة 5 إجمالي التكلفة $3.478 زمن الاستجابة (المتوسط) 17.2s
#155	Kimi K2.5 none	Moonshot AI	1	5.5	$0.127	6/22	19.2s
إجمالي الاختبارات 22 الاختبارات الخاطئة 16 إجمالي التكلفة $0.127 زمن الاستجابة (المتوسط) 19.2s
#138	Kimi K2.6 none	Moonshot AI	1	5.8	$0.184	7/22	19.6s
إجمالي الاختبارات 22 الاختبارات الخاطئة 15 إجمالي التكلفة $0.184 زمن الاستجابة (المتوسط) 19.6s
#67	Step 3.7 Flash low	Stepfun	1	7.3	$0.454	12/22	20.7s
إجمالي الاختبارات 22 الاختبارات الخاطئة 10 إجمالي التكلفة $0.454 زمن الاستجابة (المتوسط) 20.7s
#21	GPT-5.2 medium	OpenAI	1	8.4	$0.951	14/22	22.6s
إجمالي الاختبارات 22 الاختبارات الخاطئة 8 إجمالي التكلفة $0.951 زمن الاستجابة (المتوسط) 22.6s
#49	GLM 5 Turbo medium	Z.ai	1	7.6	$0.323	14/21	23.0s
إجمالي الاختبارات 21 الاختبارات الخاطئة 7 إجمالي التكلفة $0.323 زمن الاستجابة (المتوسط) 23.0s

←

1 2 3 4 5

→

إخفاقات لا توجد إجابة

تصفية النماذج

أفضل النماذج حسب عدد لا توجد إجابة

عدد لا توجد إجابة مقابل النتيجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)