ترتيب إخفاقات لا توجد إجابة

اكتشف أي نماذج الذكاء الاصطناعي تواجه لا توجد إجابة أكثر من غيرها، حتى ترى مخاطر الاعتمادية قبل الاختيار. الترتيب حسب: اختبارات صحيحة ↑.

النماذج المعروضة

إجمالي الإخفاقات

النموذج الأكثر تأثرًا

Qwen3.5-9B 2

الفئات

ضمن الفئة مجمّع29 ضمن الفئة البرمجة18 ضمن الفئة معلومات عامة13 ضمن الفئة تحليل البيانات واستخراجها8 ضمن الفئة خاص بالمجال8 ضمن الفئة حيل مضادة للذكاء الاصطناعي4 ضمن الفئة حل الألغاز3 ضمن الفئة اتباع التعليمات2 ضمن الفئة استدعاء الأدوات2

67/67

الترتيب	النموذج	الشركة	عدد لا توجد إجابة	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#138	Kimi K2.6 none	Moonshot AI	1	5.8	$0.184	7/22	19.6s
إجمالي الاختبارات 22 الاختبارات الخاطئة 15 إجمالي التكلفة $0.184 زمن الاستجابة (المتوسط) 19.6s
#151	GLM 5.1 none	Z.ai	1	5.5	$0.164	7/22	6.70s
إجمالي الاختبارات 22 الاختبارات الخاطئة 15 إجمالي التكلفة $0.164 زمن الاستجابة (المتوسط) 6.70s
#112	Claude Sonnet 5 none	Anthropic	2	6.3	$0.548	8/22	6.04s
إجمالي الاختبارات 22 الاختبارات الخاطئة 14 إجمالي التكلفة $0.548 زمن الاستجابة (المتوسط) 6.04s
#116	Seed-2.0-Lite none	Bytedance Seed	1	6.2	$0.066	8/22	4.40s
إجمالي الاختبارات 22 الاختبارات الخاطئة 14 إجمالي التكلفة $0.066 زمن الاستجابة (المتوسط) 4.40s
#132	GPT-5.6 Terra none	OpenAI	1	6.0	$0.349	8/22	1.65s
إجمالي الاختبارات 22 الاختبارات الخاطئة 14 إجمالي التكلفة $0.349 زمن الاستجابة (المتوسط) 1.65s
#140	Nemotron 3 Super medium	NVIDIA	1	5.7	$0.050	8/22	52.0s
إجمالي الاختبارات 22 الاختبارات الخاطئة 14 إجمالي التكلفة $0.050 زمن الاستجابة (المتوسط) 52.0s
#97	LongCat 2.0 high	Meituan	2	6.6	$0.469	9/22	148.7s
إجمالي الاختبارات 22 الاختبارات الخاطئة 13 إجمالي التكلفة $0.469 زمن الاستجابة (المتوسط) 148.7s
#102	Laguna XS 2.1 medium	Poolside	1	6.5	$0.068	9/22	47.9s
إجمالي الاختبارات 22 الاختبارات الخاطئة 13 إجمالي التكلفة $0.068 زمن الاستجابة (المتوسط) 47.9s
#122	Gemini 3.1 Flash Lite none	Google	1	6.1	$0.046	9/22	1.75s
إجمالي الاختبارات 22 الاختبارات الخاطئة 13 إجمالي التكلفة $0.046 زمن الاستجابة (المتوسط) 1.75s
#128	GPT-5 Nano medium	OpenAI	1	6.1	$0.114	9/22	54.9s
إجمالي الاختبارات 22 الاختبارات الخاطئة 13 إجمالي التكلفة $0.114 زمن الاستجابة (المتوسط) 54.9s
#46	DeepSeek V4 Pro high	DeepSeek	1	7.7	$0.200	10/22	79.1s
إجمالي الاختبارات 22 الاختبارات الخاطئة 12 إجمالي التكلفة $0.200 زمن الاستجابة (المتوسط) 79.1s
#77	Kimi K2.5 medium	Moonshot AI	2	7.0	$0.600	10/22	99.0s
إجمالي الاختبارات 22 الاختبارات الخاطئة 12 إجمالي التكلفة $0.600 زمن الاستجابة (المتوسط) 99.0s
#91	LongCat 2.0 low	Meituan	1	6.7	$0.391	10/22	100.3s
إجمالي الاختبارات 22 الاختبارات الخاطئة 12 إجمالي التكلفة $0.391 زمن الاستجابة (المتوسط) 100.3s
#99	Qwen3.6 27B medium	Qwen	3	6.5	$0.779	10/22	106.3s
إجمالي الاختبارات 22 الاختبارات الخاطئة 12 إجمالي التكلفة $0.779 زمن الاستجابة (المتوسط) 106.3s
#120	Gemini 3.1 Flash Lite minimal	Google	1	6.1	$0.047	10/22	1.86s
إجمالي الاختبارات 22 الاختبارات الخاطئة 12 إجمالي التكلفة $0.047 زمن الاستجابة (المتوسط) 1.86s

←

1 2 3 4 5

→

إخفاقات لا توجد إجابة

تصفية النماذج

أفضل النماذج حسب عدد لا توجد إجابة

عدد لا توجد إجابة مقابل النتيجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)