ترتيب إخفاقات خطأ API

اكتشف أي نماذج الذكاء الاصطناعي تواجه خطأ API أكثر من غيرها، حتى ترى مخاطر الاعتمادية قبل الاختيار. الترتيب حسب: اختبارات صحيحة ↓.

النماذج المعروضة

إجمالي الإخفاقات

161

النموذج الأكثر تأثرًا

Kimi K3 2

الفئات

ضمن الفئة البرمجة45 ضمن الفئة مجمّع26 ضمن الفئة استدعاء الأدوات17 ضمن الفئة تحليل البيانات واستخراجها14 ضمن الفئة حيل مضادة للذكاء الاصطناعي14 ضمن الفئة معلومات عامة13 ضمن الفئة الذكاء العام12 ضمن الفئة حل الألغاز12 ضمن الفئة خاص بالمجال7 ضمن الفئة اتباع التعليمات1

68/68

الترتيب	النموذج	الشركة	عدد خطأ API	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#46	DeepSeek V4 Pro high	DeepSeek	1	7.7	$0.200	10/22	79.1s
إجمالي الاختبارات 22 الاختبارات الخاطئة 12 إجمالي التكلفة $0.200 زمن الاستجابة (المتوسط) 79.1s
#91	LongCat 2.0 low	Meituan	1	6.7	$0.391	10/22	100.3s
إجمالي الاختبارات 22 الاختبارات الخاطئة 12 إجمالي التكلفة $0.391 زمن الاستجابة (المتوسط) 100.3s
#115	Gemma 4 31B none	Google	2	6.2	$0.035	10/22	5.34s
إجمالي الاختبارات 22 الاختبارات الخاطئة 12 إجمالي التكلفة $0.035 زمن الاستجابة (المتوسط) 5.34s
#181	Grok 4.20 Multi Agent Beta medium	X AI	2	4.8	$5.599	8/18	9.69s
إجمالي الاختبارات 18 الاختبارات الخاطئة 10 إجمالي التكلفة $5.599 زمن الاستجابة (المتوسط) 9.69s
#184	Hunter Alpha medium	OpenRouter	1	4.7	$0.000	8/18	10.3s
إجمالي الاختبارات 18 الاختبارات الخاطئة 10 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 10.3s
#137	North Mini Code medium	Cohere	1	5.9	$0.000	9/22	137.1s
إجمالي الاختبارات 22 الاختبارات الخاطئة 13 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 137.1s
#179	Ring-2.6-1T none	Inclusionai	6	4.8	$0.026	9/22	55.1s
إجمالي الاختبارات 22 الاختبارات الخاطئة 13 إجمالي التكلفة $0.026 زمن الاستجابة (المتوسط) 55.1s
#146	Owl Alpha medium	Openrouter	1	5.6	$0.000	8/21	11.9s
إجمالي الاختبارات 21 الاختبارات الخاطئة 13 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 11.9s
#157	Mimo V2 Omni none	Xiaomi	1	5.5	$0.021	8/21	2.44s
إجمالي الاختبارات 21 الاختبارات الخاطئة 13 إجمالي التكلفة $0.021 زمن الاستجابة (المتوسط) 2.44s
#202	Grok Build 0.1 none	X AI	3	4.0	$0.547	7/19	28.7s
إجمالي الاختبارات 19 الاختبارات الخاطئة 12 إجمالي التكلفة $0.547 زمن الاستجابة (المتوسط) 28.7s
#129	Nemotron 3 Ultra none	NVIDIA	1	6.1	$0.095	8/22	3.87s
إجمالي الاختبارات 22 الاختبارات الخاطئة 14 إجمالي التكلفة $0.095 زمن الاستجابة (المتوسط) 3.87s
#140	Nemotron 3 Super medium	NVIDIA	4	5.7	$0.050	8/22	52.0s
إجمالي الاختبارات 22 الاختبارات الخاطئة 14 إجمالي التكلفة $0.050 زمن الاستجابة (المتوسط) 52.0s
#149	KAT-Coder-Air V2.5 medium	Kwaipilot	1	5.6	$0.048	8/22	8.42s
إجمالي الاختبارات 22 الاختبارات الخاطئة 14 إجمالي التكلفة $0.048 زمن الاستجابة (المتوسط) 8.42s
#147	Mimo V2 PRO none	Xiaomi	1	5.6	$0.045	7/21	2.27s
إجمالي الاختبارات 21 الاختبارات الخاطئة 14 إجمالي التكلفة $0.045 زمن الاستجابة (المتوسط) 2.27s
#188	Cobuddy medium	Baidu	1	4.7	$0.000	7/21	39.9s
إجمالي الاختبارات 21 الاختبارات الخاطئة 14 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 39.9s

←

1 2 3 4 5

→

إخفاقات خطأ API

تصفية النماذج

أفضل النماذج حسب عدد خطأ API

عدد خطأ API مقابل النتيجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)