ترتيب النماذج لفئة حيل مضادة للذكاء الاصطناعي

اكتشف أي نماذج الذكاء الاصطناعي تؤدي أفضل في حيل مضادة للذكاء الاصطناعي، وأيها يظل أكثر اعتمادية، وأين تظهر أكبر الفجوات.

النماذج المعروضة

متوسط درجة حيل مضادة للذكاء الاصطناعي

7.1

أفضل نموذج

Gemini 3.6 Flash 10.0

أسباب الفشل

مع سبب الفشل إجابة خاطئة306 مع سبب الفشل لم يتبع التعليمات33 مع سبب الفشل تنسيق إضافي20 مع سبب الفشل خطأ API15 مع سبب الفشل لا توجد إجابة6 مع سبب الفشل انتهت المهلة4

220/220

الترتيب	النموذج	الشركة	درجة حيل مضادة للذكاء الاصطناعي	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#102	LongCat 2.0 high	Meituan	8.9	6.6	$0.469	3/4	7.76s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.469 زمن الاستجابة (المتوسط) 7.76s
#155	KAT-Coder-Air V2.5 medium	Kwaipilot	8.7	5.6	$0.048	3/4	3.79s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.048 زمن الاستجابة (المتوسط) 3.79s
#8	GPT-5.6 Sol high	OpenAI	8.7	9.4	$1.234	3/4	3.39s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $1.234 زمن الاستجابة (المتوسط) 3.39s
#16	GPT-5.3-Codex medium	OpenAI	8.7	8.9	$0.920	3/4	4.16s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.920 زمن الاستجابة (المتوسط) 4.16s
#33	Step 3.7 Flash medium	Stepfun	8.7	8.0	$0.515	3/4	9.65s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.515 زمن الاستجابة (المتوسط) 9.65s
#34	GPT-5.2 Chat none	OpenAI	8.7	8.0	$0.604	3/4	3.40s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.604 زمن الاستجابة (المتوسط) 3.40s
#36	Inkling medium	Thinkingmachines	8.7	8.0	$0.391	3/4	6.49s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.391 زمن الاستجابة (المتوسط) 6.49s
#62	Qwen3.5-27B medium	Qwen	8.7	7.4	$1.627	3/4	19.8s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $1.627 زمن الاستجابة (المتوسط) 19.8s
#71	Step 3.7 Flash low	Stepfun	8.7	7.3	$0.454	3/4	4.02s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.454 زمن الاستجابة (المتوسط) 4.02s
#97	KAT-Coder-Pro V2.5 none	Kwaipilot	8.7	6.7	$0.476	3/4	4.58s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.476 زمن الاستجابة (المتوسط) 4.58s
#137	Grok 4.20 Beta medium	X AI	8.7	6.0	$0.750	3/4	3.16s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.750 زمن الاستجابة (المتوسط) 3.16s
#194	Grok 4.1 Fast medium	X AI	8.7	4.7	$0.069	3/4	3.81s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.069 زمن الاستجابة (المتوسط) 3.81s
#197	Cobuddy medium	Baidu	8.7	4.7	$0.000	3/4	10.00s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 10.00s
#212	Grok Build 0.1 none	X AI	8.7	4.0	$0.547	3/4	6.30s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.547 زمن الاستجابة (المتوسط) 6.30s
#149	Gemini 3.1 Flash Lite high	Google	8.7	5.6	$2.044	3/4	37.2s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $2.044 زمن الاستجابة (المتوسط) 37.2s

ترتيب حيل مضادة للذكاء الاصطناعي

تصفية النماذج

أفضل النماذج حسب درجة حيل مضادة للذكاء الاصطناعي

درجة حيل مضادة للذكاء الاصطناعي مقابل إجمالي التكلفة

أفضل النماذج حسب زمن الاستجابة (المتوسط)