ترتيب النماذج لفئة حيل مضادة للذكاء الاصطناعي

اكتشف أي نماذج الذكاء الاصطناعي تؤدي أفضل في حيل مضادة للذكاء الاصطناعي، وأيها يظل أكثر اعتمادية، وأين تظهر أكبر الفجوات. الترتيب حسب: اختبارات صحيحة ↓.

النماذج المعروضة

متوسط درجة حيل مضادة للذكاء الاصطناعي

7.1

أفضل نموذج

Gemini 3 Flash Preview 10.0

أسباب الفشل

مع سبب الفشل إجابة خاطئة293 مع سبب الفشل لم يتبع التعليمات33 مع سبب الفشل تنسيق إضافي20 مع سبب الفشل خطأ API14 مع سبب الفشل انتهت المهلة4 مع سبب الفشل لا توجد إجابة4

210/210

الترتيب	النموذج	الشركة	درجة حيل مضادة للذكاء الاصطناعي	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#22	Grok 4.5 medium	X AI	10.0	8.3	$1.928	4/4	23.5s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $1.928 زمن الاستجابة (المتوسط) 23.5s
#23	Claude Sonnet 5 medium	Anthropic	10.0	8.3	$0.922	4/4	3.80s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.922 زمن الاستجابة (المتوسط) 3.80s
#28	Inkling high	Thinkingmachines	10.0	8.0	$1.006	4/4	12.7s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $1.006 زمن الاستجابة (المتوسط) 12.7s
#31	GLM 5.2 high	Z.ai	10.0	8.0	$0.970	4/4	5.80s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.970 زمن الاستجابة (المتوسط) 5.80s
#33	Kimi K3 max	Moonshot AI	10.0	8.0	$3.112	4/4	10.2s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $3.112 زمن الاستجابة (المتوسط) 10.2s
#36	Qwen3.7 Plus medium	Qwen	10.0	7.9	$0.267	4/4	8.58s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.267 زمن الاستجابة (المتوسط) 8.58s
#37	Qwen3.6 Plus medium	Qwen	10.0	7.8	$0.405	4/4	9.90s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.405 زمن الاستجابة (المتوسط) 9.90s
#38	GLM 5.2 medium	Z.ai	10.0	7.8	$0.222	4/4	5.89s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.222 زمن الاستجابة (المتوسط) 5.89s
#41	Claude Opus 4.8 low	Anthropic	10.0	7.8	$2.077	4/4	3.30s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $2.077 زمن الاستجابة (المتوسط) 3.30s
#42	GLM 5 medium	Z.ai	10.0	7.7	$0.307	4/4	23.7s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.307 زمن الاستجابة (المتوسط) 23.7s
#49	GLM 5 Turbo medium	Z.ai	10.0	7.6	$0.323	4/4	4.82s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.323 زمن الاستجابة (المتوسط) 4.82s
#51	Nemotron 3 Ultra medium	NVIDIA	10.0	7.5	$0.774	4/4	8.62s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.774 زمن الاستجابة (المتوسط) 8.62s
#60	LongCat 2.0 medium	Meituan	10.0	7.4	$0.478	4/4	9.65s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.478 زمن الاستجابة (المتوسط) 9.65s
#61	Gemini 3 Flash Preview low	Google	10.0	7.4	$0.177	4/4	3.48s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.177 زمن الاستجابة (المتوسط) 3.48s
#70	Qwen3.5 Plus 2026-04-20 medium	Qwen	10.0	7.2	$0.317	4/4	10.8s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.317 زمن الاستجابة (المتوسط) 10.8s

ترتيب حيل مضادة للذكاء الاصطناعي

تصفية النماذج

أفضل النماذج حسب درجة حيل مضادة للذكاء الاصطناعي

درجة حيل مضادة للذكاء الاصطناعي مقابل إجمالي التكلفة

أفضل النماذج حسب زمن الاستجابة (المتوسط)