ترتيب النماذج لفئة حيل مضادة للذكاء الاصطناعي

اكتشف أي نماذج الذكاء الاصطناعي تؤدي أفضل في حيل مضادة للذكاء الاصطناعي، وأيها يظل أكثر اعتمادية، وأين تظهر أكبر الفجوات.

النماذج المعروضة

متوسط درجة حيل مضادة للذكاء الاصطناعي

7.2

أفضل نموذج

Gemini 3.6 Flash 10.0

أسباب الفشل

مع سبب الفشل إجابة خاطئة293 مع سبب الفشل لم يتبع التعليمات33 مع سبب الفشل تنسيق إضافي20 مع سبب الفشل خطأ API14 مع سبب الفشل انتهت المهلة4 مع سبب الفشل لا توجد إجابة4

216/216

الترتيب	النموذج	الشركة	درجة حيل مضادة للذكاء الاصطناعي	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#201	Elephant Alpha medium	Openrouter	6.6	4.3	$0.000	2/4	1.19s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 1.19s
#24	GPT-5.2 medium	OpenAI	6.5	8.4	$0.951	2/4	7.81s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.951 زمن الاستجابة (المتوسط) 7.81s
#44	Claude Sonnet 4.6 medium	Anthropic	6.5	7.8	$2.057	2/4	2.98s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $2.057 زمن الاستجابة (المتوسط) 2.98s
#63	Qwen3.7 Max none	Qwen	6.5	7.4	$0.197	2/4	1.08s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.197 زمن الاستجابة (المتوسط) 1.08s
#70	Claude Opus 4.8 none	Anthropic	6.5	7.3	$1.166	2/4	3.40s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $1.166 زمن الاستجابة (المتوسط) 3.40s
#75	Qwen3.7 Plus none	Qwen	6.5	7.2	$0.106	2/4	1.38s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.106 زمن الاستجابة (المتوسط) 1.38s
#92	Gemini 3.5 Flash minimal	Google	6.5	6.8	$0.300	2/4	892ms
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.300 زمن الاستجابة (المتوسط) 892ms
#121	Gemma 4 31B none	Google	6.5	6.2	$0.021	2/4	1.85s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.021 زمن الاستجابة (المتوسط) 1.85s
#192	Laguna M.1 medium	Poolside	6.5	4.7	$0.033	2/4	4.87s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.033 زمن الاستجابة (المتوسط) 4.87s
#212	gpt-oss-120b none	OpenAI	6.5	3.7	$0.010	2/4	32.8s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.010 زمن الاستجابة (المتوسط) 32.8s
#134	GPT-5 Nano medium	OpenAI	6.5	6.1	$0.114	2/4	25.5s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.114 زمن الاستجابة (المتوسط) 25.5s
#141	Hy3 preview high	Tencent	6.4	5.9	$0.048	2/4	15.1s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.048 زمن الاستجابة (المتوسط) 15.1s
#213	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	6.4	3.4	$0.000	2/4	1.20s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 1.20s
#47	Claude Opus 4.6 medium	Anthropic	6.4	7.7	$3.059	2/4	7.45s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $3.059 زمن الاستجابة (المتوسط) 7.45s
#50	DeepSeek V4 Pro high	DeepSeek	5.7	7.7	$0.200	1/4	25.7s
إجمالي الاختبارات 4 الاختبارات الخاطئة 3 إجمالي التكلفة $0.200 زمن الاستجابة (المتوسط) 25.7s

←

1 9 10 11 15

→

ترتيب حيل مضادة للذكاء الاصطناعي

تصفية النماذج

أفضل النماذج حسب درجة حيل مضادة للذكاء الاصطناعي

درجة حيل مضادة للذكاء الاصطناعي مقابل إجمالي التكلفة

أفضل النماذج حسب زمن الاستجابة (المتوسط)