ترتيب إخفاقات خطأ API

اكتشف أي نماذج الذكاء الاصطناعي تواجه خطأ API أكثر من غيرها، حتى ترى مخاطر الاعتمادية قبل الاختيار. الترتيب حسب: زمن الاستجابة (المتوسط) ↑.

النماذج المعروضة

إجمالي الإخفاقات

161

النموذج الأكثر تأثرًا

Nemotron 3 Nano Omni 30b A3b Reasoning 6

الفئات

ضمن الفئة البرمجة45 ضمن الفئة مجمّع26 ضمن الفئة استدعاء الأدوات17 ضمن الفئة تحليل البيانات واستخراجها14 ضمن الفئة حيل مضادة للذكاء الاصطناعي14 ضمن الفئة معلومات عامة13 ضمن الفئة الذكاء العام12 ضمن الفئة حل الألغاز12 ضمن الفئة خاص بالمجال7 ضمن الفئة اتباع التعليمات1

68/68

الترتيب	النموذج	الشركة	عدد خطأ API	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#188	Cobuddy medium	Baidu	1	4.7	$0.000	7/21	39.9s
إجمالي الاختبارات 21 الاختبارات الخاطئة 14 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 39.9s
#134	Mimo V2 Omni medium	Xiaomi	1	5.9	$0.683	10/21	41.2s
إجمالي الاختبارات 21 الاختبارات الخاطئة 11 إجمالي التكلفة $0.683 زمن الاستجابة (المتوسط) 41.2s
#172	MiniMax M2.7 medium	Minimax	1	5.0	$0.163	5/22	41.3s
إجمالي الاختبارات 22 الاختبارات الخاطئة 17 إجمالي التكلفة $0.163 زمن الاستجابة (المتوسط) 41.3s
#37	Qwen3.6 Plus medium	Qwen	1	7.8	$0.405	15/22	43.1s
إجمالي الاختبارات 22 الاختبارات الخاطئة 7 إجمالي التكلفة $0.405 زمن الاستجابة (المتوسط) 43.1s
#74	GLM 5.1 medium	Z.ai	1	7.1	$0.535	13/22	46.8s
إجمالي الاختبارات 22 الاختبارات الخاطئة 9 إجمالي التكلفة $0.535 زمن الاستجابة (المتوسط) 46.8s
#140	Nemotron 3 Super medium	NVIDIA	4	5.7	$0.050	8/22	52.0s
إجمالي الاختبارات 22 الاختبارات الخاطئة 14 إجمالي التكلفة $0.050 زمن الاستجابة (المتوسط) 52.0s
#179	Ring-2.6-1T none	Inclusionai	6	4.8	$0.026	9/22	55.1s
إجمالي الاختبارات 22 الاختبارات الخاطئة 13 إجمالي التكلفة $0.026 زمن الاستجابة (المتوسط) 55.1s
#135	Hy3 preview high	Tencent	7	5.9	$0.048	11/21	56.6s
إجمالي الاختبارات 21 الاختبارات الخاطئة 10 إجمالي التكلفة $0.048 زمن الاستجابة (المتوسط) 56.6s
#90	Qwen3.6 35B A3B medium	Qwen	2	6.7	$0.746	13/22	58.1s
إجمالي الاختبارات 22 الاختبارات الخاطئة 9 إجمالي التكلفة $0.746 زمن الاستجابة (المتوسط) 58.1s
#76	DeepSeek V3.2 medium	DeepSeek	2	7.0	$0.078	11/22	68.6s
إجمالي الاختبارات 22 الاختبارات الخاطئة 11 إجمالي التكلفة $0.078 زمن الاستجابة (المتوسط) 68.6s
#108	Ring-2.6-1T medium	Inclusionai	2	6.3	$0.103	11/22	68.7s
إجمالي الاختبارات 22 الاختبارات الخاطئة 11 إجمالي التكلفة $0.103 زمن الاستجابة (المتوسط) 68.7s
#110	Gemma 4 31B medium	Google	2	6.3	$0.163	14/22	75.4s
إجمالي الاختبارات 22 الاختبارات الخاطئة 8 إجمالي التكلفة $0.163 زمن الاستجابة (المتوسط) 75.4s
#46	DeepSeek V4 Pro high	DeepSeek	1	7.7	$0.200	10/22	79.1s
إجمالي الاختبارات 22 الاختبارات الخاطئة 12 إجمالي التكلفة $0.200 زمن الاستجابة (المتوسط) 79.1s
#204	Qwen3.5-9B medium	Qwen	1	3.8	$0.036	3/22	82.2s
إجمالي الاختبارات 22 الاختبارات الخاطئة 19 إجمالي التكلفة $0.036 زمن الاستجابة (المتوسط) 82.2s
#52	Kimi K2.7 Code medium	Moonshot AI	1	7.5	$0.751	12/22	84.2s
إجمالي الاختبارات 22 الاختبارات الخاطئة 10 إجمالي التكلفة $0.751 زمن الاستجابة (المتوسط) 84.2s

←

1 2 3 4 5

→

إخفاقات خطأ API

تصفية النماذج

أفضل النماذج حسب عدد خطأ API

عدد خطأ API مقابل النتيجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)