ترتيب النماذج لفئة حيل مضادة للذكاء الاصطناعي

اكتشف أي نماذج الذكاء الاصطناعي تؤدي أفضل في حيل مضادة للذكاء الاصطناعي، وأيها يظل أكثر اعتمادية، وأين تظهر أكبر الفجوات.

النماذج المعروضة

متوسط درجة حيل مضادة للذكاء الاصطناعي

7.2

أفضل نموذج

Gemini 3.6 Flash 10.0

أسباب الفشل

مع سبب الفشل إجابة خاطئة293 مع سبب الفشل لم يتبع التعليمات33 مع سبب الفشل تنسيق إضافي20 مع سبب الفشل خطأ API14 مع سبب الفشل انتهت المهلة4 مع سبب الفشل لا توجد إجابة4

216/216

الترتيب	النموذج	الشركة	درجة حيل مضادة للذكاء الاصطناعي	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#173	Mistral Small 4 medium	Mistral	5.6	5.1	$0.096	1/4	2.67s
إجمالي الاختبارات 4 الاختبارات الخاطئة 3 إجمالي التكلفة $0.096 زمن الاستجابة (المتوسط) 2.67s
#51	MiniMax M3 medium	Minimax	5.5	7.6	$0.286	1/4	14.9s
إجمالي الاختبارات 4 الاختبارات الخاطئة 3 إجمالي التكلفة $0.286 زمن الاستجابة (المتوسط) 14.9s
#118	Claude Sonnet 5 none	Anthropic	5.3	6.3	$0.548	1/4	3.60s
إجمالي الاختبارات 4 الاختبارات الخاطئة 3 إجمالي التكلفة $0.548 زمن الاستجابة (المتوسط) 3.60s
#166	Laguna XS 2.1 none	Poolside	5.3	5.3	$0.008	1/4	755ms
إجمالي الاختبارات 4 الاختبارات الخاطئة 3 إجمالي التكلفة $0.008 زمن الاستجابة (المتوسط) 755ms
#188	KAT-Coder-Air V2.5 none	Kwaipilot	5.3	4.8	$0.067	1/4	2.68s
إجمالي الاختبارات 4 الاختبارات الخاطئة 3 إجمالي التكلفة $0.067 زمن الاستجابة (المتوسط) 2.68s
#103	Qwen3.6 Max Preview none	Qwen	5.2	6.6	$0.231	1/4	2.63s
إجمالي الاختبارات 4 الاختبارات الخاطئة 3 إجمالي التكلفة $0.231 زمن الاستجابة (المتوسط) 2.63s
#182	GLM 4.7 Flash none	Z.ai	5.2	4.9	$0.016	1/4	5.51s
إجمالي الاختبارات 4 الاختبارات الخاطئة 3 إجمالي التكلفة $0.016 زمن الاستجابة (المتوسط) 5.51s
#210	Qwen3.5-9B medium	Qwen	5.1	3.8	$0.036	1/4	34.4s
إجمالي الاختبارات 4 الاختبارات الخاطئة 3 إجمالي التكلفة $0.036 زمن الاستجابة (المتوسط) 34.4s
#207	Granite 4.1 8B none	IBM Granite	4.9	4.0	$0.007	1/4	844ms
إجمالي الاختبارات 4 الاختبارات الخاطئة 3 إجمالي التكلفة $0.007 زمن الاستجابة (المتوسط) 844ms
#183	Nemotron 3 Super none	NVIDIA	4.8	4.9	$0.008	1/4	4.46s
إجمالي الاختبارات 4 الاختبارات الخاطئة 3 إجمالي التكلفة $0.008 زمن الاستجابة (المتوسط) 4.46s
#67	Claude Sonnet 4.6 none	Anthropic	4.8	7.3	$0.661	1/4	2.94s
إجمالي الاختبارات 4 الاختبارات الخاطئة 3 إجمالي التكلفة $0.661 زمن الاستجابة (المتوسط) 2.94s
#108	Laguna XS 2.1 medium	Poolside	4.8	6.5	$0.068	1/4	42.0s
إجمالي الاختبارات 4 الاختبارات الخاطئة 3 إجمالي التكلفة $0.068 زمن الاستجابة (المتوسط) 42.0s
#109	Qwen3.5-27B none	Qwen	4.8	6.5	$0.090	1/4	788ms
إجمالي الاختبارات 4 الاختبارات الخاطئة 3 إجمالي التكلفة $0.090 زمن الاستجابة (المتوسط) 788ms
#113	Qwen3.5 Plus 2026-02-15 none	Qwen	4.8	6.4	$0.073	1/4	1.91s
إجمالي الاختبارات 4 الاختبارات الخاطئة 3 إجمالي التكلفة $0.073 زمن الاستجابة (المتوسط) 1.91s
#117	LongCat 2.0 none	Meituan	4.8	6.3	$0.044	1/4	2.87s
إجمالي الاختبارات 4 الاختبارات الخاطئة 3 إجمالي التكلفة $0.044 زمن الاستجابة (المتوسط) 2.87s

ترتيب حيل مضادة للذكاء الاصطناعي

تصفية النماذج

أفضل النماذج حسب درجة حيل مضادة للذكاء الاصطناعي

درجة حيل مضادة للذكاء الاصطناعي مقابل إجمالي التكلفة

أفضل النماذج حسب زمن الاستجابة (المتوسط)