ترتيب النماذج لفئة خاص بالمجال

اكتشف أي نماذج الذكاء الاصطناعي تؤدي أفضل في خاص بالمجال، وأيها يظل أكثر اعتمادية، وأين تظهر أكبر الفجوات. الترتيب حسب: زمن الاستجابة (المتوسط) ↓.

النماذج المعروضة

متوسط درجة خاص بالمجال

4.7

أفضل نموذج

Kimi K3 5.9

أسباب الفشل

مع سبب الفشل إجابة خاطئة421 مع سبب الفشل انتهت المهلة43 مع سبب الفشل تنسيق إضافي17 مع سبب الفشل لا توجد إجابة8 مع سبب الفشل خطأ API7 مع سبب الفشل لم يتبع التعليمات1

216/216

الترتيب	النموذج	الشركة	درجة خاص بالمجال	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#107	MiMo-V2.5 medium	Xiaomi	5.3	6.5	$0.082	1/3	34.5s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.082 زمن الاستجابة (المتوسط) 34.5s
#10	Gemini 3.1 Pro Preview medium	Google	7.7	9.2	$1.361	2/3	32.7s
إجمالي الاختبارات 3 الاختبارات الخاطئة 1 إجمالي التكلفة $1.361 زمن الاستجابة (المتوسط) 32.7s
#78	GLM 5.1 medium	Z.ai	5.3	7.1	$0.535	1/3	29.8s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.535 زمن الاستجابة (المتوسط) 29.8s
#27	Muse Spark 1.1 low	Meta	2.9	8.3	$0.647	0/3	29.7s
إجمالي الاختبارات 3 الاختبارات الخاطئة 3 إجمالي التكلفة $0.647 زمن الاستجابة (المتوسط) 29.7s
#41	Qwen3.6 Plus medium	Qwen	2.9	7.8	$0.405	0/3	29.6s
إجمالي الاختبارات 3 الاختبارات الخاطئة 3 إجمالي التكلفة $0.405 زمن الاستجابة (المتوسط) 29.6s
#5	GPT-5.6 Sol low	OpenAI	5.3	9.5	$0.971	1/3	29.1s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.971 زمن الاستجابة (المتوسط) 29.1s
#85	KAT-Coder-Pro V2.5 medium	Kwaipilot	2.9	6.9	$0.467	0/3	29.0s
إجمالي الاختبارات 3 الاختبارات الخاطئة 3 إجمالي التكلفة $0.467 زمن الاستجابة (المتوسط) 29.0s
#9	GPT-5.5 low	OpenAI	5.3	9.3	$1.253	1/3	28.1s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $1.253 زمن الاستجابة (المتوسط) 28.1s
#79	Grok 4.20 medium	X AI	5.3	7.1	$0.777	1/3	27.0s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.777 زمن الاستجابة (المتوسط) 27.0s
#2	Gemini 3.6 Flash high	Google	10.0	9.7	$1.785	3/3	26.0s
إجمالي الاختبارات 3 الاختبارات الخاطئة 0 إجمالي التكلفة $1.785 زمن الاستجابة (المتوسط) 26.0s
#11	Qwen3.7 Max medium	Qwen	5.9	9.2	$1.116	1/3	24.9s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $1.116 زمن الاستجابة (المتوسط) 24.9s
#55	Nemotron 3 Ultra medium	NVIDIA	3.5	7.5	$0.774	0/3	24.9s
إجمالي الاختبارات 3 الاختبارات الخاطئة 3 إجمالي التكلفة $0.774 زمن الاستجابة (المتوسط) 24.9s
#187	Grok 4.20 Multi Agent Beta medium	X AI	2.9	4.8	$5.599	0/3	24.7s
إجمالي الاختبارات 3 الاختبارات الخاطئة 3 إجمالي التكلفة $5.599 زمن الاستجابة (المتوسط) 24.7s
#80	DeepSeek V3.2 medium	DeepSeek	2.9	7.0	$0.078	0/3	24.3s
إجمالي الاختبارات 3 الاختبارات الخاطئة 3 إجمالي التكلفة $0.078 زمن الاستجابة (المتوسط) 24.3s
#192	Laguna M.1 medium	Poolside	5.3	4.7	$0.033	1/3	24.1s
إجمالي الاختبارات 3 الاختبارات الخاطئة 2 إجمالي التكلفة $0.033 زمن الاستجابة (المتوسط) 24.1s

ترتيب خاص بالمجال

تصفية النماذج

أفضل النماذج حسب درجة خاص بالمجال

درجة خاص بالمجال مقابل إجمالي التكلفة

أفضل النماذج حسب زمن الاستجابة (المتوسط)