ترتيب النماذج لفئة حيل مضادة للذكاء الاصطناعي

اكتشف أي نماذج الذكاء الاصطناعي تؤدي أفضل في حيل مضادة للذكاء الاصطناعي، وأيها يظل أكثر اعتمادية، وأين تظهر أكبر الفجوات.

النماذج المعروضة

متوسط درجة حيل مضادة للذكاء الاصطناعي

7.2

أفضل نموذج

Gemini 3.6 Flash 10.0

أسباب الفشل

مع سبب الفشل إجابة خاطئة293 مع سبب الفشل لم يتبع التعليمات33 مع سبب الفشل تنسيق إضافي20 مع سبب الفشل خطأ API14 مع سبب الفشل انتهت المهلة4 مع سبب الفشل لا توجد إجابة4

216/216

الترتيب	النموذج	الشركة	درجة حيل مضادة للذكاء الاصطناعي	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#60	GPT-5.4 Mini medium	OpenAI	8.6	7.5	$0.756	3/4	4.05s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.756 زمن الاستجابة (المتوسط) 4.05s
#28	Gemini 2.5 Flash medium	Google	8.4	8.2	$0.643	3/4	6.30s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.643 زمن الاستجابة (المتوسط) 6.30s
#143	North Mini Code medium	Cohere	8.4	5.9	$0.000	3/4	64.8s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 64.8s
#5	GPT-5.6 Sol low	OpenAI	8.3	9.5	$0.971	3/4	2.60s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.971 زمن الاستجابة (المتوسط) 2.60s
#18	Claude Opus 4.7 medium	Anthropic	8.3	8.7	$1.477	3/4	1.85s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $1.477 زمن الاستجابة (المتوسط) 1.85s
#21	GPT-5.4 medium	OpenAI	8.3	8.5	$1.533	3/4	4.11s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $1.533 زمن الاستجابة (المتوسط) 4.11s
#38	GPT-5.6 Terra high	OpenAI	8.3	8.0	$1.055	3/4	2.54s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $1.055 زمن الاستجابة (المتوسط) 2.54s
#39	Seed-2.0-Lite medium	Bytedance Seed	8.3	7.9	$0.234	3/4	18.0s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.234 زمن الاستجابة (المتوسط) 18.0s
#43	GPT-5.6 Terra medium	OpenAI	8.3	7.8	$0.676	3/4	2.22s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.676 زمن الاستجابة (المتوسط) 2.22s
#48	GPT-5.6 Luna high	OpenAI	8.3	7.7	$1.017	3/4	2.99s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $1.017 زمن الاستجابة (المتوسط) 2.99s
#49	DeepSeek V4 Flash high	DeepSeek	8.3	7.7	$0.041	3/4	28.5s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.041 زمن الاستجابة (المتوسط) 28.5s
#52	Grok Build 0.1 medium	X AI	8.3	7.6	$1.097	3/4	7.43s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $1.097 زمن الاستجابة (المتوسط) 7.43s
#54	GPT-5.6 Luna medium	OpenAI	8.3	7.6	$0.352	3/4	2.52s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.352 زمن الاستجابة (المتوسط) 2.52s
#57	GPT-5.4 Nano medium	OpenAI	8.3	7.5	$0.138	3/4	4.52s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.138 زمن الاستجابة (المتوسط) 4.52s
#59	GPT-5.6 Terra low	OpenAI	8.3	7.5	$0.519	3/4	2.36s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.519 زمن الاستجابة (المتوسط) 2.36s

ترتيب حيل مضادة للذكاء الاصطناعي

تصفية النماذج

أفضل النماذج حسب درجة حيل مضادة للذكاء الاصطناعي

درجة حيل مضادة للذكاء الاصطناعي مقابل إجمالي التكلفة

أفضل النماذج حسب زمن الاستجابة (المتوسط)