ترتيب النماذج لفئة حيل مضادة للذكاء الاصطناعي

اكتشف أي نماذج الذكاء الاصطناعي تؤدي أفضل في حيل مضادة للذكاء الاصطناعي، وأيها يظل أكثر اعتمادية، وأين تظهر أكبر الفجوات. الترتيب حسب: زمن الاستجابة (المتوسط) ↑.

النماذج المعروضة

متوسط درجة حيل مضادة للذكاء الاصطناعي

7.2

أفضل نموذج

Mistral Small 4 3.4

أسباب الفشل

مع سبب الفشل إجابة خاطئة293 مع سبب الفشل لم يتبع التعليمات33 مع سبب الفشل تنسيق إضافي20 مع سبب الفشل خطأ API14 مع سبب الفشل انتهت المهلة4 مع سبب الفشل لا توجد إجابة4

216/216

الترتيب	النموذج	الشركة	درجة حيل مضادة للذكاء الاصطناعي	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#47	Claude Opus 4.6 medium	Anthropic	6.4	7.7	$3.059	2/4	7.45s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $3.059 زمن الاستجابة (المتوسط) 7.45s
#102	LongCat 2.0 high	Meituan	8.9	6.6	$0.469	3/4	7.76s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.469 زمن الاستجابة (المتوسط) 7.76s
#24	GPT-5.2 medium	OpenAI	6.5	8.4	$0.951	2/4	7.81s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.951 زمن الاستجابة (المتوسط) 7.81s
#146	Nemotron 3 Super medium	NVIDIA	8.3	5.7	$0.055	3/4	7.85s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.055 زمن الاستجابة (المتوسط) 7.85s
#10	Gemini 3.1 Pro Preview medium	Google	10.0	9.2	$1.361	4/4	7.90s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $1.361 زمن الاستجابة (المتوسط) 7.90s
#78	GLM 5.1 medium	Z.ai	10.0	7.1	$0.535	4/4	8.31s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.535 زمن الاستجابة (المتوسط) 8.31s
#40	Qwen3.7 Plus medium	Qwen	10.0	7.9	$0.267	4/4	8.58s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.267 زمن الاستجابة (المتوسط) 8.58s
#30	Muse Spark 1.1 high	Meta	7.5	8.1	$1.694	2/4	8.60s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $1.694 زمن الاستجابة (المتوسط) 8.60s
#55	Nemotron 3 Ultra medium	NVIDIA	10.0	7.5	$0.774	4/4	8.62s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.774 زمن الاستجابة (المتوسط) 8.62s
#193	Qwen3 Coder Next medium	Qwen	3.5	4.7	$0.032	0/4	8.64s
إجمالي الاختبارات 4 الاختبارات الخاطئة 4 إجمالي التكلفة $0.032 زمن الاستجابة (المتوسط) 8.64s
#77	Grok 4.3 medium	X AI	10.0	7.1	$0.779	4/4	8.83s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.779 زمن الاستجابة (المتوسط) 8.83s
#96	LongCat 2.0 low	Meituan	10.0	6.7	$0.391	4/4	9.04s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.391 زمن الاستجابة (المتوسط) 9.04s
#159	Hy3 preview low	Tencent	8.3	5.5	$0.015	3/4	9.32s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.015 زمن الاستجابة (المتوسط) 9.32s
#179	DeepSeek V3.2 none	DeepSeek	3.2	5.0	$0.054	0/4	9.35s
إجمالي الاختبارات 4 الاختبارات الخاطئة 4 إجمالي التكلفة $0.054 زمن الاستجابة (المتوسط) 9.35s
#64	LongCat 2.0 medium	Meituan	10.0	7.4	$0.478	4/4	9.65s
إجمالي الاختبارات 4 الاختبارات الخاطئة 0 إجمالي التكلفة $0.478 زمن الاستجابة (المتوسط) 9.65s

ترتيب حيل مضادة للذكاء الاصطناعي

تصفية النماذج

أفضل النماذج حسب درجة حيل مضادة للذكاء الاصطناعي

درجة حيل مضادة للذكاء الاصطناعي مقابل إجمالي التكلفة

أفضل النماذج حسب زمن الاستجابة (المتوسط)