ترتيب إخفاقات خطأ API

اكتشف أي نماذج الذكاء الاصطناعي تواجه خطأ API أكثر من غيرها، حتى ترى مخاطر الاعتمادية قبل الاختيار. الترتيب حسب: اختبارات صحيحة ↓.

النماذج المعروضة

إجمالي الإخفاقات

161

النموذج الأكثر تأثرًا

Kimi K3 2

الفئات

ضمن الفئة البرمجة45 ضمن الفئة مجمّع26 ضمن الفئة استدعاء الأدوات17 ضمن الفئة تحليل البيانات واستخراجها14 ضمن الفئة حيل مضادة للذكاء الاصطناعي14 ضمن الفئة معلومات عامة13 ضمن الفئة الذكاء العام12 ضمن الفئة حل الألغاز12 ضمن الفئة خاص بالمجال7 ضمن الفئة اتباع التعليمات1

68/68

الترتيب	النموذج	الشركة	عدد خطأ API	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#33	Kimi K3 max	Moonshot AI	2	8.0	$3.112	16/22	122.5s
إجمالي الاختبارات 22 الاختبارات الخاطئة 6 إجمالي التكلفة $3.112 زمن الاستجابة (المتوسط) 122.5s
#32	Inkling medium	Thinkingmachines	1	8.0	$0.391	15/22	16.2s
إجمالي الاختبارات 22 الاختبارات الخاطئة 7 إجمالي التكلفة $0.391 زمن الاستجابة (المتوسط) 16.2s
#37	Qwen3.6 Plus medium	Qwen	1	7.8	$0.405	15/22	43.1s
إجمالي الاختبارات 22 الاختبارات الخاطئة 7 إجمالي التكلفة $0.405 زمن الاستجابة (المتوسط) 43.1s
#79	Gemini 3.5 Flash none	Google	4	7.0	$1.079	15/22	9.93s
إجمالي الاختبارات 22 الاختبارات الخاطئة 7 إجمالي التكلفة $1.079 زمن الاستجابة (المتوسط) 9.93s
#100	Hy3 preview medium	Tencent	3	6.5	$0.018	14/21	16.3s
إجمالي الاختبارات 21 الاختبارات الخاطئة 7 إجمالي التكلفة $0.018 زمن الاستجابة (المتوسط) 16.3s
#133	Gemini 3 PRO Preview medium	Google	4	6.0	$0.385	14/21	9.05s
إجمالي الاختبارات 21 الاختبارات الخاطئة 7 إجمالي التكلفة $0.385 زمن الاستجابة (المتوسط) 9.05s
#57	Qwen3.5 Plus 2026-02-15 medium	Qwen	1	7.5	$0.437	14/22	89.2s
إجمالي الاختبارات 22 الاختبارات الخاطئة 8 إجمالي التكلفة $0.437 زمن الاستجابة (المتوسط) 89.2s
#110	Gemma 4 31B medium	Google	2	6.3	$0.163	14/22	75.4s
إجمالي الاختبارات 22 الاختبارات الخاطئة 8 إجمالي التكلفة $0.163 زمن الاستجابة (المتوسط) 75.4s
#51	Nemotron 3 Ultra medium	NVIDIA	1	7.5	$0.774	13/22	32.2s
إجمالي الاختبارات 22 الاختبارات الخاطئة 9 إجمالي التكلفة $0.774 زمن الاستجابة (المتوسط) 32.2s
#74	GLM 5.1 medium	Z.ai	1	7.1	$0.535	13/22	46.8s
إجمالي الاختبارات 22 الاختبارات الخاطئة 9 إجمالي التكلفة $0.535 زمن الاستجابة (المتوسط) 46.8s
#90	Qwen3.6 35B A3B medium	Qwen	2	6.7	$0.746	13/22	58.1s
إجمالي الاختبارات 22 الاختبارات الخاطئة 9 إجمالي التكلفة $0.746 زمن الاستجابة (المتوسط) 58.1s
#109	Mimo V2 PRO medium	Xiaomi	1	6.3	$0.333	12/21	22.2s
إجمالي الاختبارات 21 الاختبارات الخاطئة 9 إجمالي التكلفة $0.333 زمن الاستجابة (المتوسط) 22.2s
#113	MiMo-V2-Flash medium	Xiaomi	1	6.3	$0.043	12/21	20.1s
إجمالي الاختبارات 21 الاختبارات الخاطئة 9 إجمالي التكلفة $0.043 زمن الاستجابة (المتوسط) 20.1s
#27	Muse Spark 1.1 high	Meta	1	8.1	$1.694	12/22	31.5s
إجمالي الاختبارات 22 الاختبارات الخاطئة 10 إجمالي التكلفة $1.694 زمن الاستجابة (المتوسط) 31.5s
#52	Kimi K2.7 Code medium	Moonshot AI	1	7.5	$0.751	12/22	84.2s
إجمالي الاختبارات 22 الاختبارات الخاطئة 10 إجمالي التكلفة $0.751 زمن الاستجابة (المتوسط) 84.2s

1 2 3 4 5

→

إخفاقات خطأ API

تصفية النماذج

أفضل النماذج حسب عدد خطأ API

عدد خطأ API مقابل النتيجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)