ترتيب إخفاقات لا توجد إجابة

اكتشف أي نماذج الذكاء الاصطناعي تواجه لا توجد إجابة أكثر من غيرها، حتى ترى مخاطر الاعتمادية قبل الاختيار. الترتيب حسب: اختبارات صحيحة ↑.

النماذج المعروضة

إجمالي الإخفاقات

النموذج الأكثر تأثرًا

Qwen3.5-9B 2

الفئات

ضمن الفئة مجمّع29 ضمن الفئة البرمجة18 ضمن الفئة معلومات عامة13 ضمن الفئة تحليل البيانات واستخراجها8 ضمن الفئة خاص بالمجال8 ضمن الفئة حيل مضادة للذكاء الاصطناعي4 ضمن الفئة حل الألغاز3 ضمن الفئة اتباع التعليمات2 ضمن الفئة استدعاء الأدوات2

67/67

الترتيب	النموذج	الشركة	عدد لا توجد إجابة	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#204	Qwen3.5-9B medium	Qwen	2	3.8	$0.036	3/22	82.2s
إجمالي الاختبارات 22 الاختبارات الخاطئة 19 إجمالي التكلفة $0.036 زمن الاستجابة (المتوسط) 82.2s
#161	Qwen3.6 35B A3B none	Qwen	1	5.3	$0.061	4/22	5.52s
إجمالي الاختبارات 22 الاختبارات الخاطئة 18 إجمالي التكلفة $0.061 زمن الاستجابة (المتوسط) 5.52s
#180	GPT-5.4 Nano none	OpenAI	1	4.8	$0.041	4/22	2.57s
إجمالي الاختبارات 22 الاختبارات الخاطئة 18 إجمالي التكلفة $0.041 زمن الاستجابة (المتوسط) 2.57s
#187	Qwen3 Coder Next medium	Qwen	1	4.7	$0.032	4/22	9.61s
إجمالي الاختبارات 22 الاختبارات الخاطئة 18 إجمالي التكلفة $0.032 زمن الاستجابة (المتوسط) 9.61s
#194	GLM 4.7 Flash medium	Z.ai	3	4.3	$0.166	4/22	142.6s
إجمالي الاختبارات 22 الاختبارات الخاطئة 18 إجمالي التكلفة $0.166 زمن الاستجابة (المتوسط) 142.6s
#207	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	1	3.4	$0.000	4/19	17.1s
إجمالي الاختبارات 19 الاختبارات الخاطئة 15 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 17.1s
#166	Qwen3 Coder Next none	Qwen	1	5.1	$0.025	5/22	9.12s
إجمالي الاختبارات 22 الاختبارات الخاطئة 17 إجمالي التكلفة $0.025 زمن الاستجابة (المتوسط) 9.12s
#167	Mistral Small 4 medium	Mistral	1	5.1	$0.096	5/22	10.8s
إجمالي الاختبارات 22 الاختبارات الخاطئة 17 إجمالي التكلفة $0.096 زمن الاستجابة (المتوسط) 10.8s
#168	MiMo-V2.5 none	Xiaomi	1	5.1	$0.025	5/22	4.62s
إجمالي الاختبارات 22 الاختبارات الخاطئة 17 إجمالي التكلفة $0.025 زمن الاستجابة (المتوسط) 4.62s
#172	MiniMax M2.7 medium	Minimax	2	5.0	$0.163	5/22	41.3s
إجمالي الاختبارات 22 الاختبارات الخاطئة 17 إجمالي التكلفة $0.163 زمن الاستجابة (المتوسط) 41.3s
#174	GPT-4o-mini none	OpenAI	1	5.0	$0.010	5/22	1.99s
إجمالي الاختبارات 22 الاختبارات الخاطئة 17 إجمالي التكلفة $0.010 زمن الاستجابة (المتوسط) 1.99s
#190	MiniMax M2.5 medium	Minimax	2	4.6	$0.340	5/22	68.3s
إجمالي الاختبارات 22 الاختبارات الخاطئة 17 إجمالي التكلفة $0.340 زمن الاستجابة (المتوسط) 68.3s
#154	MiMo-V2.5-Pro none	Xiaomi	1	5.5	$0.068	6/22	4.12s
إجمالي الاختبارات 22 الاختبارات الخاطئة 16 إجمالي التكلفة $0.068 زمن الاستجابة (المتوسط) 4.12s
#155	Kimi K2.5 none	Moonshot AI	1	5.5	$0.127	6/22	19.2s
إجمالي الاختبارات 22 الاختبارات الخاطئة 16 إجمالي التكلفة $0.127 زمن الاستجابة (المتوسط) 19.2s
#198	Laguna Xs.2 medium	Poolside	2	4.1	$0.015	6/19	6.73s
إجمالي الاختبارات 19 الاختبارات الخاطئة 13 إجمالي التكلفة $0.015 زمن الاستجابة (المتوسط) 6.73s

1 2 3 4 5

→

إخفاقات لا توجد إجابة

تصفية النماذج

أفضل النماذج حسب عدد لا توجد إجابة

عدد لا توجد إجابة مقابل النتيجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)