ترتيب النماذج لفئة حيل مضادة للذكاء الاصطناعي

اكتشف أي نماذج الذكاء الاصطناعي تؤدي أفضل في حيل مضادة للذكاء الاصطناعي، وأيها يظل أكثر اعتمادية، وأين تظهر أكبر الفجوات.

النماذج المعروضة

متوسط درجة حيل مضادة للذكاء الاصطناعي

7.2

أفضل نموذج

Gemini 3.6 Flash 10.0

أسباب الفشل

مع سبب الفشل إجابة خاطئة293 مع سبب الفشل لم يتبع التعليمات33 مع سبب الفشل تنسيق إضافي20 مع سبب الفشل خطأ API14 مع سبب الفشل انتهت المهلة4 مع سبب الفشل لا توجد إجابة4

216/216

الترتيب	النموذج	الشركة	درجة حيل مضادة للذكاء الاصطناعي	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#87	GPT-5.6 Sol none	OpenAI	8.3	6.9	$0.524	3/4	1.27s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.524 زمن الاستجابة (المتوسط) 1.27s
#93	Gemini 3 Flash Preview none	Google	8.3	6.8	$0.085	3/4	1.25s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.085 زمن الاستجابة (المتوسط) 1.25s
#99	Claude Opus 4.7 none	Anthropic	8.3	6.6	$0.505	3/4	2.12s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.505 زمن الاستجابة (المتوسط) 2.12s
#101	GLM 5.2 none	Z.ai	8.3	6.6	$0.128	3/4	3.70s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.128 زمن الاستجابة (المتوسط) 3.70s
#105	Qwen3.6 27B medium	Qwen	8.3	6.5	$0.779	3/4	12.6s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.779 زمن الاستجابة (المتوسط) 12.6s
#110	Gemini 3.1 Flash Lite Preview low	Google	8.3	6.5	$0.646	3/4	2.12s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.646 زمن الاستجابة (المتوسط) 2.12s
#123	GPT-5.6 Luna low	OpenAI	8.3	6.2	$0.249	3/4	2.21s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.249 زمن الاستجابة (المتوسط) 2.21s
#126	Gemini 3.1 Flash Lite minimal	Google	8.3	6.1	$0.047	3/4	1.10s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.047 زمن الاستجابة (المتوسط) 1.10s
#129	Inkling low	Thinkingmachines	8.3	6.1	$0.187	3/4	2.51s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.187 زمن الاستجابة (المتوسط) 2.51s
#146	Nemotron 3 Super medium	NVIDIA	8.3	5.7	$0.055	3/4	7.85s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.055 زمن الاستجابة (المتوسط) 7.85s
#159	Hy3 preview low	Tencent	8.3	5.5	$0.015	3/4	9.32s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.015 زمن الاستجابة (المتوسط) 9.32s
#162	Gemma 4 26B A4B none	Google	8.3	5.5	$0.015	3/4	1.28s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.015 زمن الاستجابة (المتوسط) 1.28s
#181	Qwen3.6 Plus Preview medium	Qwen	8.3	4.9	$0.000	3/4	11.7s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 11.7s
#61	Qwen3.5 Plus 2026-02-15 medium	Qwen	8.2	7.5	$0.437	3/4	45.8s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.437 زمن الاستجابة (المتوسط) 45.8s
#79	Grok 4.20 medium	X AI	8.2	7.1	$0.777	3/4	3.95s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.777 زمن الاستجابة (المتوسط) 3.95s

ترتيب حيل مضادة للذكاء الاصطناعي

تصفية النماذج

أفضل النماذج حسب درجة حيل مضادة للذكاء الاصطناعي

درجة حيل مضادة للذكاء الاصطناعي مقابل إجمالي التكلفة

أفضل النماذج حسب زمن الاستجابة (المتوسط)