ترتيب إخفاقات لا توجد إجابة

اكتشف أي نماذج الذكاء الاصطناعي تواجه لا توجد إجابة أكثر من غيرها، حتى ترى مخاطر الاعتمادية قبل الاختيار. الترتيب حسب: زمن الاستجابة (المتوسط) ↓.

النماذج المعروضة

إجمالي الإخفاقات

النموذج الأكثر تأثرًا

Step 3.5 Flash 1

الفئات

ضمن الفئة مجمّع29 ضمن الفئة البرمجة18 ضمن الفئة معلومات عامة13 ضمن الفئة تحليل البيانات واستخراجها8 ضمن الفئة خاص بالمجال8 ضمن الفئة حيل مضادة للذكاء الاصطناعي4 ضمن الفئة حل الألغاز3 ضمن الفئة اتباع التعليمات2 ضمن الفئة استدعاء الأدوات2

67/67

الترتيب	النموذج	الشركة	عدد لا توجد إجابة	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#130	Step 3.5 Flash medium	Stepfun	1	6.0	$0.108	11/21	174.2s
إجمالي الاختبارات 21 الاختبارات الخاطئة 10 إجمالي التكلفة $0.108 زمن الاستجابة (المتوسط) 174.2s
#97	LongCat 2.0 high	Meituan	2	6.6	$0.469	9/22	148.7s
إجمالي الاختبارات 22 الاختبارات الخاطئة 13 إجمالي التكلفة $0.469 زمن الاستجابة (المتوسط) 148.7s
#194	GLM 4.7 Flash medium	Z.ai	3	4.3	$0.166	4/22	142.6s
إجمالي الاختبارات 22 الاختبارات الخاطئة 18 إجمالي التكلفة $0.166 زمن الاستجابة (المتوسط) 142.6s
#60	LongCat 2.0 medium	Meituan	1	7.4	$0.478	12/22	136.6s
إجمالي الاختبارات 22 الاختبارات الخاطئة 10 إجمالي التكلفة $0.478 زمن الاستجابة (المتوسط) 136.6s
#33	Kimi K3 max	Moonshot AI	1	8.0	$3.112	16/22	122.5s
إجمالي الاختبارات 22 الاختبارات الخاطئة 6 إجمالي التكلفة $3.112 زمن الاستجابة (المتوسط) 122.5s
#119	Qwen3.5-35B-A3B medium	Qwen	2	6.2	$0.837	11/22	112.5s
إجمالي الاختبارات 22 الاختبارات الخاطئة 11 إجمالي التكلفة $0.837 زمن الاستجابة (المتوسط) 112.5s
#68	Kimi K2.6 medium	Moonshot AI	1	7.2	$1.036	12/22	110.0s
إجمالي الاختبارات 22 الاختبارات الخاطئة 10 إجمالي التكلفة $1.036 زمن الاستجابة (المتوسط) 110.0s
#99	Qwen3.6 27B medium	Qwen	3	6.5	$0.779	10/22	106.3s
إجمالي الاختبارات 22 الاختبارات الخاطئة 12 إجمالي التكلفة $0.779 زمن الاستجابة (المتوسط) 106.3s
#95	Gemma 4 26B A4B medium	Google	2	6.6	$0.089	14/22	103.8s
إجمالي الاختبارات 22 الاختبارات الخاطئة 8 إجمالي التكلفة $0.089 زمن الاستجابة (المتوسط) 103.8s
#91	LongCat 2.0 low	Meituan	1	6.7	$0.391	10/22	100.3s
إجمالي الاختبارات 22 الاختبارات الخاطئة 12 إجمالي التكلفة $0.391 زمن الاستجابة (المتوسط) 100.3s
#77	Kimi K2.5 medium	Moonshot AI	2	7.0	$0.600	10/22	99.0s
إجمالي الاختبارات 22 الاختبارات الخاطئة 12 إجمالي التكلفة $0.600 زمن الاستجابة (المتوسط) 99.0s
#80	Seed-2.0-Mini medium	Bytedance Seed	1	7.0	$0.101	11/22	92.5s
إجمالي الاختبارات 22 الاختبارات الخاطئة 11 إجمالي التكلفة $0.101 زمن الاستجابة (المتوسط) 92.5s
#204	Qwen3.5-9B medium	Qwen	2	3.8	$0.036	3/22	82.2s
إجمالي الاختبارات 22 الاختبارات الخاطئة 19 إجمالي التكلفة $0.036 زمن الاستجابة (المتوسط) 82.2s
#46	DeepSeek V4 Pro high	DeepSeek	1	7.7	$0.200	10/22	79.1s
إجمالي الاختبارات 22 الاختبارات الخاطئة 12 إجمالي التكلفة $0.200 زمن الاستجابة (المتوسط) 79.1s
#12	Grok 4.5 high	X AI	2	8.9	$1.707	17/22	76.5s
إجمالي الاختبارات 22 الاختبارات الخاطئة 5 إجمالي التكلفة $1.707 زمن الاستجابة (المتوسط) 76.5s

1 2 3 4 5

→

إخفاقات لا توجد إجابة

تصفية النماذج

أفضل النماذج حسب عدد لا توجد إجابة

عدد لا توجد إجابة مقابل النتيجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)