ترتيب النماذج لفئة حيل مضادة للذكاء الاصطناعي

اكتشف أي نماذج الذكاء الاصطناعي تؤدي أفضل في حيل مضادة للذكاء الاصطناعي، وأيها يظل أكثر اعتمادية، وأين تظهر أكبر الفجوات.

النماذج المعروضة

متوسط درجة حيل مضادة للذكاء الاصطناعي

7.2

أفضل نموذج

Gemini 3.6 Flash 10.0

أسباب الفشل

مع سبب الفشل إجابة خاطئة293 مع سبب الفشل لم يتبع التعليمات33 مع سبب الفشل تنسيق إضافي20 مع سبب الفشل خطأ API14 مع سبب الفشل انتهت المهلة4 مع سبب الفشل لا توجد إجابة4

216/216

الترتيب	النموذج	الشركة	درجة حيل مضادة للذكاء الاصطناعي	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#98	GLM 5V Turbo medium	Z.ai	7.2	6.7	$0.457	2/4	10.8s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.457 زمن الاستجابة (المتوسط) 10.8s
#29	GPT-5 Mini medium	OpenAI	7.1	8.1	$0.237	2/4	13.9s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.237 زمن الاستجابة (المتوسط) 13.9s
#72	Kimi K2.6 medium	Moonshot AI	7.0	7.2	$1.036	2/4	11.6s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $1.036 زمن الاستجابة (المتوسط) 11.6s
#73	KAT-Coder-Pro V2.5 high	Kwaipilot	7.0	7.2	$0.482	2/4	3.17s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.482 زمن الاستجابة (المتوسط) 3.17s
#91	GPT-5.5 none	OpenAI	6.9	6.9	$0.544	2/4	1.31s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.544 زمن الاستجابة (المتوسط) 1.31s
#204	Laguna Xs.2 medium	Poolside	6.9	4.1	$0.015	2/4	2.68s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.015 زمن الاستجابة (المتوسط) 2.68s
#66	KAT-Coder-Pro V2.5 low	Kwaipilot	6.9	7.4	$0.387	2/4	4.20s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.387 زمن الاستجابة (المتوسط) 4.20s
#82	Mercury 2 medium	Inception	6.9	7.0	$0.093	2/4	1.12s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.093 زمن الاستجابة (المتوسط) 1.12s
#150	KAT-Coder-Air V2.5 high	Kwaipilot	6.9	5.6	$0.077	2/4	2.49s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.077 زمن الاستجابة (المتوسط) 2.49s
#187	Grok 4.20 Multi Agent Beta medium	X AI	6.9	4.8	$5.599	2/4	3.46s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $5.599 زمن الاستجابة (المتوسط) 3.46s
#184	Ling-2.6-flash none	Inclusionai	6.8	4.9	$0.002	2/4	11.8s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.002 زمن الاستجابة (المتوسط) 11.8s
#58	GPT-5.3 Chat none	OpenAI	6.7	7.5	$0.571	2/4	3.86s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.571 زمن الاستجابة (المتوسط) 3.86s
#127	gpt-oss-120b medium	OpenAI	6.7	6.1	$0.019	2/4	10.2s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.019 زمن الاستجابة (المتوسط) 10.2s
#84	Seed-2.0-Mini medium	Bytedance Seed	6.6	7.0	$0.101	2/4	74.7s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.101 زمن الاستجابة (المتوسط) 74.7s
#199	Elephant Alpha none	Openrouter	6.6	4.3	$0.000	2/4	963ms
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 963ms

ترتيب حيل مضادة للذكاء الاصطناعي

تصفية النماذج

أفضل النماذج حسب درجة حيل مضادة للذكاء الاصطناعي

درجة حيل مضادة للذكاء الاصطناعي مقابل إجمالي التكلفة

أفضل النماذج حسب زمن الاستجابة (المتوسط)