ترتيب النماذج لفئة حيل مضادة للذكاء الاصطناعي

اكتشف أي نماذج الذكاء الاصطناعي تؤدي أفضل في حيل مضادة للذكاء الاصطناعي، وأيها يظل أكثر اعتمادية، وأين تظهر أكبر الفجوات. الترتيب حسب: المقياس ↑.

النماذج المعروضة

متوسط درجة حيل مضادة للذكاء الاصطناعي

7.2

أفضل نموذج

LFM2-24B-A2B 2.5

أسباب الفشل

مع سبب الفشل إجابة خاطئة293 مع سبب الفشل لم يتبع التعليمات33 مع سبب الفشل تنسيق إضافي20 مع سبب الفشل خطأ API14 مع سبب الفشل انتهت المهلة4 مع سبب الفشل لا توجد إجابة4

216/216

الترتيب	النموذج	الشركة	درجة حيل مضادة للذكاء الاصطناعي	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#182	GLM 4.7 Flash none	Z.ai	5.2	4.9	$0.016	1/4	5.51s
إجمالي الاختبارات 4 الاختبارات الخاطئة 3 إجمالي التكلفة $0.016 زمن الاستجابة (المتوسط) 5.51s
#188	KAT-Coder-Air V2.5 none	Kwaipilot	5.3	4.8	$0.067	1/4	2.68s
إجمالي الاختبارات 4 الاختبارات الخاطئة 3 إجمالي التكلفة $0.067 زمن الاستجابة (المتوسط) 2.68s
#166	Laguna XS 2.1 none	Poolside	5.3	5.3	$0.008	1/4	755ms
إجمالي الاختبارات 4 الاختبارات الخاطئة 3 إجمالي التكلفة $0.008 زمن الاستجابة (المتوسط) 755ms
#118	Claude Sonnet 5 none	Anthropic	5.3	6.3	$0.548	1/4	3.60s
إجمالي الاختبارات 4 الاختبارات الخاطئة 3 إجمالي التكلفة $0.548 زمن الاستجابة (المتوسط) 3.60s
#51	MiniMax M3 medium	Minimax	5.5	7.6	$0.286	1/4	14.9s
إجمالي الاختبارات 4 الاختبارات الخاطئة 3 إجمالي التكلفة $0.286 زمن الاستجابة (المتوسط) 14.9s
#173	Mistral Small 4 medium	Mistral	5.6	5.1	$0.096	1/4	2.67s
إجمالي الاختبارات 4 الاختبارات الخاطئة 3 إجمالي التكلفة $0.096 زمن الاستجابة (المتوسط) 2.67s
#50	DeepSeek V4 Pro high	DeepSeek	5.7	7.7	$0.200	1/4	25.7s
إجمالي الاختبارات 4 الاختبارات الخاطئة 3 إجمالي التكلفة $0.200 زمن الاستجابة (المتوسط) 25.7s
#47	Claude Opus 4.6 medium	Anthropic	6.4	7.7	$3.059	2/4	7.45s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $3.059 زمن الاستجابة (المتوسط) 7.45s
#141	Hy3 preview high	Tencent	6.4	5.9	$0.048	2/4	15.1s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.048 زمن الاستجابة (المتوسط) 15.1s
#213	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	6.4	3.4	$0.000	2/4	1.20s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 1.20s
#134	GPT-5 Nano medium	OpenAI	6.5	6.1	$0.114	2/4	25.5s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.114 زمن الاستجابة (المتوسط) 25.5s
#44	Claude Sonnet 4.6 medium	Anthropic	6.5	7.8	$2.057	2/4	2.98s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $2.057 زمن الاستجابة (المتوسط) 2.98s
#63	Qwen3.7 Max none	Qwen	6.5	7.4	$0.197	2/4	1.08s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.197 زمن الاستجابة (المتوسط) 1.08s
#70	Claude Opus 4.8 none	Anthropic	6.5	7.3	$1.166	2/4	3.40s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $1.166 زمن الاستجابة (المتوسط) 3.40s
#75	Qwen3.7 Plus none	Qwen	6.5	7.2	$0.106	2/4	1.38s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.106 زمن الاستجابة (المتوسط) 1.38s

ترتيب حيل مضادة للذكاء الاصطناعي

تصفية النماذج

أفضل النماذج حسب درجة حيل مضادة للذكاء الاصطناعي

درجة حيل مضادة للذكاء الاصطناعي مقابل إجمالي التكلفة

أفضل النماذج حسب زمن الاستجابة (المتوسط)