ترتيب إخفاقات خطأ API

اكتشف أي نماذج الذكاء الاصطناعي تواجه خطأ API أكثر من غيرها، حتى ترى مخاطر الاعتمادية قبل الاختيار.

النماذج المعروضة

إجمالي الإخفاقات

159

النموذج الأكثر تأثرًا

الفئات

ضمن الفئة البرمجة44 ضمن الفئة مجمّع25 ضمن الفئة استدعاء الأدوات17 ضمن الفئة تحليل البيانات واستخراجها14 ضمن الفئة حيل مضادة للذكاء الاصطناعي14 ضمن الفئة معلومات عامة13 ضمن الفئة الذكاء العام12 ضمن الفئة حل الألغاز12 ضمن الفئة خاص بالمجال7 ضمن الفئة اتباع التعليمات1

66/66

الترتيب	النموذج	الشركة	عدد خطأ API	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#171	Qwen3.6 Plus Preview medium	Qwen	8	4.9	$0.000	9/19	15.2s
إجمالي الاختبارات 19 الاختبارات الخاطئة 10 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 15.2s
#131	Hy3 preview high	Tencent	7	5.9	$0.048	11/21	56.6s
إجمالي الاختبارات 21 الاختبارات الخاطئة 10 إجمالي التكلفة $0.048 زمن الاستجابة (المتوسط) 56.6s
#149	Hy3 preview low	Tencent	7	5.5	$0.015	10/21	24.6s
إجمالي الاختبارات 21 الاختبارات الخاطئة 11 إجمالي التكلفة $0.015 زمن الاستجابة (المتوسط) 24.6s
#175	Ring-2.6-1T none	Inclusionai	6	4.8	$0.026	9/22	55.1s
إجمالي الاختبارات 22 الاختبارات الخاطئة 13 إجمالي التكلفة $0.026 زمن الاستجابة (المتوسط) 55.1s
#203	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	6	3.4	$0.000	4/19	17.1s
إجمالي الاختبارات 19 الاختبارات الخاطئة 15 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 17.1s
#204	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	6	3.2	$0.000	2/19	728ms
إجمالي الاختبارات 19 الاختبارات الخاطئة 17 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 728ms
#78	Gemini 3.5 Flash none	Google	4	7.0	$1.079	15/22	9.93s
إجمالي الاختبارات 22 الاختبارات الخاطئة 7 إجمالي التكلفة $1.079 زمن الاستجابة (المتوسط) 9.93s
#129	Gemini 3 PRO Preview medium	Google	4	6.0	$0.385	14/21	9.05s
إجمالي الاختبارات 21 الاختبارات الخاطئة 7 إجمالي التكلفة $0.385 زمن الاستجابة (المتوسط) 9.05s
#136	Nemotron 3 Super medium	NVIDIA	4	5.7	$0.066	8/22	52.0s
إجمالي الاختبارات 22 الاختبارات الخاطئة 14 إجمالي التكلفة $0.066 زمن الاستجابة (المتوسط) 52.0s
#169	DeepSeek V3.2 none	DeepSeek	4	5.0	$0.054	6/22	18.3s
إجمالي الاختبارات 22 الاختبارات الخاطئة 16 إجمالي التكلفة $0.054 زمن الاستجابة (المتوسط) 18.3s
#182	Laguna M.1 medium	Poolside	4	4.7	$0.033	9/19	14.7s
إجمالي الاختبارات 19 الاختبارات الخاطئة 10 إجمالي التكلفة $0.033 زمن الاستجابة (المتوسط) 14.7s
#188	Laguna M.1 none	Poolside	4	4.4	$0.009	4/19	2.89s
إجمالي الاختبارات 19 الاختبارات الخاطئة 15 إجمالي التكلفة $0.009 زمن الاستجابة (المتوسط) 2.89s
#194	Laguna Xs.2 medium	Poolside	4	4.1	$0.015	6/19	6.73s
إجمالي الاختبارات 19 الاختبارات الخاطئة 13 إجمالي التكلفة $0.015 زمن الاستجابة (المتوسط) 6.73s
#195	Hy3 preview none	Tencent	4	4.0	$0.003	4/21	12.9s
إجمالي الاختبارات 21 الاختبارات الخاطئة 17 إجمالي التكلفة $0.003 زمن الاستجابة (المتوسط) 12.9s
#201	Laguna Xs.2 none	Poolside	4	3.8	$0.004	5/19	806ms
إجمالي الاختبارات 19 الاختبارات الخاطئة 14 إجمالي التكلفة $0.004 زمن الاستجابة (المتوسط) 806ms

1 2 3 4 5

→

إخفاقات خطأ API

تصفية النماذج

أفضل النماذج حسب عدد خطأ API

عدد خطأ API مقابل النتيجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)