ترتيب النماذج لفئة حيل مضادة للذكاء الاصطناعي

اكتشف أي نماذج الذكاء الاصطناعي تؤدي أفضل في حيل مضادة للذكاء الاصطناعي، وأيها يظل أكثر اعتمادية، وأين تظهر أكبر الفجوات. الترتيب حسب: زمن الاستجابة (المتوسط) ↓.

النماذج المعروضة

متوسط درجة حيل مضادة للذكاء الاصطناعي

7.2

أفضل نموذج

Seed-2.0-Mini 6.6

أسباب الفشل

مع سبب الفشل إجابة خاطئة293 مع سبب الفشل لم يتبع التعليمات33 مع سبب الفشل تنسيق إضافي20 مع سبب الفشل خطأ API14 مع سبب الفشل انتهت المهلة4 مع سبب الفشل لا توجد إجابة4

216/216

الترتيب	النموذج	الشركة	درجة حيل مضادة للذكاء الاصطناعي	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#9	GPT-5.5 low	OpenAI	10.0	9.3	$1.253	4/4	4.41s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $1.253 زمن الاستجابة (المتوسط) 4.41s
#27	Muse Spark 1.1 low	Meta	7.9	8.3	$0.647	2/4	4.36s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.647 زمن الاستجابة (المتوسط) 4.36s
#66	KAT-Coder-Pro V2.5 low	Kwaipilot	6.9	7.4	$0.387	2/4	4.20s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.387 زمن الاستجابة (المتوسط) 4.20s
#16	GPT-5.3-Codex medium	OpenAI	8.7	8.9	$0.920	3/4	4.16s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.920 زمن الاستجابة (المتوسط) 4.16s
#107	MiMo-V2.5 medium	Xiaomi	10.0	6.5	$0.082	4/4	4.14s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.082 زمن الاستجابة (المتوسط) 4.14s
#21	GPT-5.4 medium	OpenAI	8.3	8.5	$1.533	3/4	4.11s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $1.533 زمن الاستجابة (المتوسط) 4.11s
#60	GPT-5.4 Mini medium	OpenAI	8.6	7.5	$0.756	3/4	4.05s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.756 زمن الاستجابة (المتوسط) 4.05s
#71	Step 3.7 Flash low	Stepfun	8.7	7.3	$0.454	3/4	4.02s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.454 زمن الاستجابة (المتوسط) 4.02s
#86	DeepSeek V4 Pro none	DeepSeek	3.2	6.9	$0.096	0/4	4.02s
إجمالي الاختبارات 4 الاختبارات الخاطئة 4 إجمالي التكلفة $0.096 زمن الاستجابة (المتوسط) 4.02s
#152	Owl Alpha medium	Openrouter	4.8	5.6	$0.000	1/4	3.97s
إجمالي الاختبارات 4 الاختبارات الخاطئة 3 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 3.97s
#79	Grok 4.20 medium	X AI	8.2	7.1	$0.777	3/4	3.95s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.777 زمن الاستجابة (المتوسط) 3.95s
#17	Claude Opus 4.8 medium	Anthropic	10.0	8.8	$1.931	4/4	3.95s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $1.931 زمن الاستجابة (المتوسط) 3.95s
#85	KAT-Coder-Pro V2.5 medium	Kwaipilot	8.2	6.9	$0.467	3/4	3.90s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.467 زمن الاستجابة (المتوسط) 3.90s
#3	Gemini 3 Flash Preview medium	Google	10.0	9.6	$0.742	4/4	3.88s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.742 زمن الاستجابة (المتوسط) 3.88s
#58	GPT-5.3 Chat none	OpenAI	6.7	7.5	$0.571	2/4	3.86s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.571 زمن الاستجابة (المتوسط) 3.86s

ترتيب حيل مضادة للذكاء الاصطناعي

تصفية النماذج

أفضل النماذج حسب درجة حيل مضادة للذكاء الاصطناعي

درجة حيل مضادة للذكاء الاصطناعي مقابل إجمالي التكلفة

أفضل النماذج حسب زمن الاستجابة (المتوسط)