ترتيب النماذج لفئة حيل مضادة للذكاء الاصطناعي

اكتشف أي نماذج الذكاء الاصطناعي تؤدي أفضل في حيل مضادة للذكاء الاصطناعي، وأيها يظل أكثر اعتمادية، وأين تظهر أكبر الفجوات.

النماذج المعروضة

متوسط درجة حيل مضادة للذكاء الاصطناعي

7.1

أفضل نموذج

Gemini 3 Flash Preview 10.0

أسباب الفشل

مع سبب الفشل إجابة خاطئة293 مع سبب الفشل لم يتبع التعليمات33 مع سبب الفشل تنسيق إضافي20 مع سبب الفشل خطأ API14 مع سبب الفشل انتهت المهلة4 مع سبب الفشل لا توجد إجابة4

210/210

الترتيب	النموذج	الشركة	درجة حيل مضادة للذكاء الاصطناعي	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#72	Qwen3.5-122B-A10B medium	Qwen	10.0	7.1	$1.046	4/4	9.75s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $1.046 زمن الاستجابة (المتوسط) 9.75s
#73	Grok 4.3 medium	X AI	10.0	7.1	$0.779	4/4	8.83s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.779 زمن الاستجابة (المتوسط) 8.83s
#74	GLM 5.1 medium	Z.ai	10.0	7.1	$0.535	4/4	8.31s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.535 زمن الاستجابة (المتوسط) 8.31s
#79	Gemini 3.5 Flash none	Google	10.0	7.0	$1.079	4/4	2.53s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $1.079 زمن الاستجابة (المتوسط) 2.53s
#84	MiMo-V2.5-Pro medium	Xiaomi	10.0	6.9	$0.187	4/4	3.26s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.187 زمن الاستجابة (المتوسط) 3.26s
#85	Qwen3.6 Flash medium	Qwen	10.0	6.9	$0.738	4/4	6.10s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.738 زمن الاستجابة (المتوسط) 6.10s
#86	Step 3.7 Flash high	Stepfun	10.0	6.9	$1.207	4/4	13.4s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $1.207 زمن الاستجابة (المتوسط) 13.4s
#90	Qwen3.6 35B A3B medium	Qwen	10.0	6.7	$0.746	4/4	6.02s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.746 زمن الاستجابة (المتوسط) 6.02s
#91	LongCat 2.0 low	Meituan	10.0	6.7	$0.391	4/4	9.04s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.391 زمن الاستجابة (المتوسط) 9.04s
#95	Gemma 4 26B A4B medium	Google	10.0	6.6	$0.089	4/4	6.20s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.089 زمن الاستجابة (المتوسط) 6.20s
#100	Hy3 preview medium	Tencent	10.0	6.5	$0.018	4/4	6.59s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.018 زمن الاستجابة (المتوسط) 6.59s
#101	MiMo-V2.5 medium	Xiaomi	10.0	6.5	$0.082	4/4	4.14s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.082 زمن الاستجابة (المتوسط) 4.14s
#108	Ring-2.6-1T medium	Inclusionai	10.0	6.3	$0.103	4/4	42.2s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.103 زمن الاستجابة (المتوسط) 42.2s
#109	Mimo V2 PRO medium	Xiaomi	10.0	6.3	$0.333	4/4	2.86s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.333 زمن الاستجابة (المتوسط) 2.86s
#110	Gemma 4 31B medium	Google	10.0	6.3	$0.163	4/4	12.9s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.163 زمن الاستجابة (المتوسط) 12.9s

ترتيب حيل مضادة للذكاء الاصطناعي

تصفية النماذج

أفضل النماذج حسب درجة حيل مضادة للذكاء الاصطناعي

درجة حيل مضادة للذكاء الاصطناعي مقابل إجمالي التكلفة

أفضل النماذج حسب زمن الاستجابة (المتوسط)