ترتيب النماذج لفئة حيل مضادة للذكاء الاصطناعي

اكتشف أي نماذج الذكاء الاصطناعي تؤدي أفضل في حيل مضادة للذكاء الاصطناعي، وأيها يظل أكثر اعتمادية، وأين تظهر أكبر الفجوات. الترتيب حسب: زمن الاستجابة (المتوسط) ↑.

النماذج المعروضة

متوسط درجة حيل مضادة للذكاء الاصطناعي

7.2

أفضل نموذج

Mistral Small 4 3.4

أسباب الفشل

مع سبب الفشل إجابة خاطئة293 مع سبب الفشل لم يتبع التعليمات33 مع سبب الفشل تنسيق إضافي20 مع سبب الفشل خطأ API14 مع سبب الفشل انتهت المهلة4 مع سبب الفشل لا توجد إجابة4

216/216

الترتيب	النموذج	الشركة	درجة حيل مضادة للذكاء الاصطناعي	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#4	Gemini 3.5 Flash high	Google	10.0	9.5	$1.976	4/4	2.57s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $1.976 زمن الاستجابة (المتوسط) 2.57s
#5	GPT-5.6 Sol low	OpenAI	8.3	9.5	$0.971	3/4	2.60s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.971 زمن الاستجابة (المتوسط) 2.60s
#103	Qwen3.6 Max Preview none	Qwen	5.2	6.6	$0.231	1/4	2.63s
إجمالي الاختبارات 4 الاختبارات الخاطئة 3 إجمالي التكلفة $0.231 زمن الاستجابة (المتوسط) 2.63s
#173	Mistral Small 4 medium	Mistral	5.6	5.1	$0.096	1/4	2.67s
إجمالي الاختبارات 4 الاختبارات الخاطئة 3 إجمالي التكلفة $0.096 زمن الاستجابة (المتوسط) 2.67s
#160	MiMo-V2.5-Pro none	Xiaomi	3.3	5.5	$0.068	0/4	2.67s
إجمالي الاختبارات 4 الاختبارات الخاطئة 4 إجمالي التكلفة $0.068 زمن الاستجابة (المتوسط) 2.67s
#204	Laguna Xs.2 medium	Poolside	6.9	4.1	$0.015	2/4	2.68s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.015 زمن الاستجابة (المتوسط) 2.68s
#188	KAT-Coder-Air V2.5 none	Kwaipilot	5.3	4.8	$0.067	1/4	2.68s
إجمالي الاختبارات 4 الاختبارات الخاطئة 3 إجمالي التكلفة $0.067 زمن الاستجابة (المتوسط) 2.68s
#140	Mimo V2 Omni medium	Xiaomi	10.0	5.9	$0.683	4/4	2.75s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.683 زمن الاستجابة (المتوسط) 2.75s
#23	Grok 4.5 low	X AI	10.0	8.4	$0.935	4/4	2.75s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.935 زمن الاستجابة (المتوسط) 2.75s
#154	Owl Alpha none	Openrouter	3.4	5.6	$0.000	0/4	2.78s
إجمالي الاختبارات 4 الاختبارات الخاطئة 4 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 2.78s
#7	GPT-5.6 Sol medium	OpenAI	10.0	9.4	$1.316	4/4	2.81s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $1.316 زمن الاستجابة (المتوسط) 2.81s
#158	Qwen3.6 27B none	Qwen	3.8	5.5	$0.087	0/4	2.83s
إجمالي الاختبارات 4 الاختبارات الخاطئة 4 إجمالي التكلفة $0.087 زمن الاستجابة (المتوسط) 2.83s
#176	GLM 5 Turbo none	Z.ai	3.0	5.1	$0.047	0/4	2.84s
إجمالي الاختبارات 4 الاختبارات الخاطئة 4 إجمالي التكلفة $0.047 زمن الاستجابة (المتوسط) 2.84s
#115	Mimo V2 PRO medium	Xiaomi	10.0	6.3	$0.333	4/4	2.86s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.333 زمن الاستجابة (المتوسط) 2.86s
#117	LongCat 2.0 none	Meituan	4.8	6.3	$0.044	1/4	2.87s
إجمالي الاختبارات 4 الاختبارات الخاطئة 3 إجمالي التكلفة $0.044 زمن الاستجابة (المتوسط) 2.87s

ترتيب حيل مضادة للذكاء الاصطناعي

تصفية النماذج

أفضل النماذج حسب درجة حيل مضادة للذكاء الاصطناعي

درجة حيل مضادة للذكاء الاصطناعي مقابل إجمالي التكلفة

أفضل النماذج حسب زمن الاستجابة (المتوسط)