ترتيب النماذج لفئة خاص بالمجال

اكتشف أي نماذج الذكاء الاصطناعي تؤدي أفضل في خاص بالمجال، وأيها يظل أكثر اعتمادية، وأين تظهر أكبر الفجوات.

النماذج المعروضة

متوسط درجة خاص بالمجال

4.7

أفضل نموذج

أسباب الفشل

مع سبب الفشل إجابة خاطئة412 مع سبب الفشل انتهت المهلة43 مع سبب الفشل تنسيق إضافي17 مع سبب الفشل لا توجد إجابة8 مع سبب الفشل خطأ API7 مع سبب الفشل لم يتبع التعليمات1

210/210

الترتيب	النموذج	الشركة	درجة خاص بالمجال	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#48	Grok Build 0.1 medium	X AI	5.3	7.6	$1.097	1/3	158.0s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $1.097 زمن الاستجابة (المتوسط) 158.0s
#50	GPT-5.6 Luna medium	OpenAI	5.3	7.6	$0.352	1/3	17.4s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.352 زمن الاستجابة (المتوسط) 17.4s
#57	Qwen3.5 Plus 2026-02-15 medium	Qwen	5.3	7.5	$0.437	1/3	17.5s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.437 زمن الاستجابة (المتوسط) 17.5s
#58	Qwen3.5-27B medium	Qwen	5.3	7.4	$1.627	1/3	79.5s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $1.627 زمن الاستجابة (المتوسط) 79.5s
#74	GLM 5.1 medium	Z.ai	5.3	7.1	$0.535	1/3	29.8s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.535 زمن الاستجابة (المتوسط) 29.8s
#75	Grok 4.20 medium	X AI	5.3	7.1	$0.777	1/3	27.0s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.777 زمن الاستجابة (المتوسط) 27.0s
#82	DeepSeek V4 Pro none	DeepSeek	5.3	6.9	$0.096	1/3	3.72s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.096 زمن الاستجابة (المتوسط) 3.72s
#84	MiMo-V2.5-Pro medium	Xiaomi	5.3	6.9	$0.187	1/3	37.9s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.187 زمن الاستجابة (المتوسط) 37.9s
#96	GLM 5.2 none	Z.ai	5.3	6.6	$0.151	1/3	4.04s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.151 زمن الاستجابة (المتوسط) 4.04s
#100	Hy3 preview medium	Tencent	5.3	6.5	$0.018	1/3	22.3s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.018 زمن الاستجابة (المتوسط) 22.3s
#101	MiMo-V2.5 medium	Xiaomi	5.3	6.5	$0.082	1/3	34.5s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.082 زمن الاستجابة (المتوسط) 34.5s
#104	Gemini 3.1 Flash Lite Preview low	Google	5.3	6.5	$0.646	1/3	2.36s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.646 زمن الاستجابة (المتوسط) 2.36s
#105	Gemini 3.1 Flash Lite low	Google	5.3	6.5	$0.621	1/3	1.52s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.621 زمن الاستجابة (المتوسط) 1.52s
#106	Gemini 3.1 Flash Lite Preview none	Google	5.3	6.4	$0.052	1/3	942ms
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.052 زمن الاستجابة (المتوسط) 942ms
#107	Qwen3.5 Plus 2026-02-15 none	Qwen	5.3	6.4	$0.073	1/3	1.17s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.073 زمن الاستجابة (المتوسط) 1.17s

ترتيب خاص بالمجال

تصفية النماذج

أفضل النماذج حسب درجة خاص بالمجال

درجة خاص بالمجال مقابل إجمالي التكلفة

أفضل النماذج حسب زمن الاستجابة (المتوسط)