ترتيب إخفاقات خطأ API

اكتشف أي نماذج الذكاء الاصطناعي تواجه خطأ API أكثر من غيرها، حتى ترى مخاطر الاعتمادية قبل الاختيار. الترتيب حسب: عدد الإخفاقات ↑.

النماذج المعروضة

إجمالي الإخفاقات

161

النموذج الأكثر تأثرًا

Muse Spark 1.1 1

الفئات

ضمن الفئة البرمجة45 ضمن الفئة مجمّع26 ضمن الفئة استدعاء الأدوات17 ضمن الفئة تحليل البيانات واستخراجها14 ضمن الفئة حيل مضادة للذكاء الاصطناعي14 ضمن الفئة معلومات عامة13 ضمن الفئة الذكاء العام12 ضمن الفئة حل الألغاز12 ضمن الفئة خاص بالمجال7 ضمن الفئة اتباع التعليمات1

68/68

الترتيب	النموذج	الشركة	عدد خطأ API	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#200	MiMo-V2-Flash none	Xiaomi	1	4.0	$0.025	4/21	2.76s
إجمالي الاختبارات 21 الاختبارات الخاطئة 17 إجمالي التكلفة $0.025 زمن الاستجابة (المتوسط) 2.76s
#204	Qwen3.5-9B medium	Qwen	1	3.8	$0.036	3/22	82.2s
إجمالي الاختبارات 22 الاختبارات الخاطئة 19 إجمالي التكلفة $0.036 زمن الاستجابة (المتوسط) 82.2s
#33	Kimi K3 max	Moonshot AI	2	8.0	$3.112	16/22	122.5s
إجمالي الاختبارات 22 الاختبارات الخاطئة 6 إجمالي التكلفة $3.112 زمن الاستجابة (المتوسط) 122.5s
#76	DeepSeek V3.2 medium	DeepSeek	2	7.0	$0.078	11/22	68.6s
إجمالي الاختبارات 22 الاختبارات الخاطئة 11 إجمالي التكلفة $0.078 زمن الاستجابة (المتوسط) 68.6s
#90	Qwen3.6 35B A3B medium	Qwen	2	6.7	$0.746	13/22	58.1s
إجمالي الاختبارات 22 الاختبارات الخاطئة 9 إجمالي التكلفة $0.746 زمن الاستجابة (المتوسط) 58.1s
#108	Ring-2.6-1T medium	Inclusionai	2	6.3	$0.103	11/22	68.7s
إجمالي الاختبارات 22 الاختبارات الخاطئة 11 إجمالي التكلفة $0.103 زمن الاستجابة (المتوسط) 68.7s
#110	Gemma 4 31B medium	Google	2	6.3	$0.163	14/22	75.4s
إجمالي الاختبارات 22 الاختبارات الخاطئة 8 إجمالي التكلفة $0.163 زمن الاستجابة (المتوسط) 75.4s
#115	Gemma 4 31B none	Google	2	6.2	$0.035	10/22	5.34s
إجمالي الاختبارات 22 الاختبارات الخاطئة 12 إجمالي التكلفة $0.035 زمن الاستجابة (المتوسط) 5.34s
#158	KAT-Coder-Air V2.5 low	Kwaipilot	2	5.4	$0.041	7/22	10.1s
إجمالي الاختبارات 22 الاختبارات الخاطئة 15 إجمالي التكلفة $0.041 زمن الاستجابة (المتوسط) 10.1s
#161	Qwen3.6 35B A3B none	Qwen	2	5.3	$0.061	4/22	5.52s
إجمالي الاختبارات 22 الاختبارات الخاطئة 18 إجمالي التكلفة $0.061 زمن الاستجابة (المتوسط) 5.52s
#167	Mistral Small 4 medium	Mistral	2	5.1	$0.096	5/22	10.8s
إجمالي الاختبارات 22 الاختبارات الخاطئة 17 إجمالي التكلفة $0.096 زمن الاستجابة (المتوسط) 10.8s
#178	Ling-2.6-flash none	Inclusionai	2	4.9	$0.002	6/22	10.7s
إجمالي الاختبارات 22 الاختبارات الخاطئة 16 إجمالي التكلفة $0.002 زمن الاستجابة (المتوسط) 10.7s
#181	Grok 4.20 Multi Agent Beta medium	X AI	2	4.8	$5.599	8/18	9.69s
إجمالي الاختبارات 18 الاختبارات الخاطئة 10 إجمالي التكلفة $5.599 زمن الاستجابة (المتوسط) 9.69s
#183	Trinity Large Preview none	Arcee AI	2	4.8	$0.008	4/21	2.98s
إجمالي الاختبارات 21 الاختبارات الخاطئة 17 إجمالي التكلفة $0.008 زمن الاستجابة (المتوسط) 2.98s
#100	Hy3 preview medium	Tencent	3	6.5	$0.018	14/21	16.3s
إجمالي الاختبارات 21 الاختبارات الخاطئة 7 إجمالي التكلفة $0.018 زمن الاستجابة (المتوسط) 16.3s

←

1 2 3 4 5

→

إخفاقات خطأ API

تصفية النماذج

أفضل النماذج حسب عدد خطأ API

عدد خطأ API مقابل النتيجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)