ترتيب النماذج لفئة حيل مضادة للذكاء الاصطناعي

اكتشف أي نماذج الذكاء الاصطناعي تؤدي أفضل في حيل مضادة للذكاء الاصطناعي، وأيها يظل أكثر اعتمادية، وأين تظهر أكبر الفجوات. الترتيب حسب: زمن الاستجابة (المتوسط) ↑.

النماذج المعروضة

متوسط درجة حيل مضادة للذكاء الاصطناعي

7.1

أفضل نموذج

Mistral Small 4 3.4

أسباب الفشل

مع سبب الفشل إجابة خاطئة293 مع سبب الفشل لم يتبع التعليمات33 مع سبب الفشل تنسيق إضافي20 مع سبب الفشل خطأ API14 مع سبب الفشل انتهت المهلة4 مع سبب الفشل لا توجد إجابة4

210/210

الترتيب	النموذج	الشركة	درجة حيل مضادة للذكاء الاصطناعي	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#132	GPT-5.6 Terra none	OpenAI	4.8	6.0	$0.349	1/4	942ms
إجمالي الاختبارات 4 الاختبارات الخاطئة 3 إجمالي التكلفة $0.349 زمن الاستجابة (المتوسط) 942ms
#193	Elephant Alpha none	Openrouter	6.6	4.3	$0.000	2/4	963ms
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 963ms
#106	Gemini 3.1 Flash Lite Preview none	Google	7.5	6.4	$0.052	2/4	1.04s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.052 زمن الاستجابة (المتوسط) 1.04s
#122	Gemini 3.1 Flash Lite none	Google	7.5	6.1	$0.046	2/4	1.07s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.046 زمن الاستجابة (المتوسط) 1.07s
#203	Grok 4.1 Fast none	X AI	3.2	3.8	$0.008	0/4	1.07s
إجمالي الاختبارات 4 الاختبارات الخاطئة 4 إجمالي التكلفة $0.008 زمن الاستجابة (المتوسط) 1.07s
#59	Qwen3.7 Max none	Qwen	6.5	7.4	$0.197	2/4	1.08s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.197 زمن الاستجابة (المتوسط) 1.08s
#120	Gemini 3.1 Flash Lite minimal	Google	8.3	6.1	$0.047	3/4	1.10s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.047 زمن الاستجابة (المتوسط) 1.10s
#78	Mercury 2 medium	Inception	6.9	7.0	$0.093	2/4	1.12s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.093 زمن الاستجابة (المتوسط) 1.12s
#180	GPT-5.4 Nano none	OpenAI	3.5	4.8	$0.041	0/4	1.18s
إجمالي الاختبارات 4 الاختبارات الخاطئة 4 إجمالي التكلفة $0.041 زمن الاستجابة (المتوسط) 1.18s
#195	Elephant Alpha medium	Openrouter	6.6	4.3	$0.000	2/4	1.19s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 1.19s
#200	MiMo-V2-Flash none	Xiaomi	3.2	4.0	$0.025	0/4	1.19s
إجمالي الاختبارات 4 الاختبارات الخاطئة 4 إجمالي التكلفة $0.025 زمن الاستجابة (المتوسط) 1.19s
#207	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	6.4	3.4	$0.000	2/4	1.20s
إجمالي الاختبارات 4 الاختبارات الخاطئة 2 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 1.20s
#139	GPT-5.4 none	OpenAI	3.2	5.8	$0.397	0/4	1.21s
إجمالي الاختبارات 4 الاختبارات الخاطئة 4 إجمالي التكلفة $0.397 زمن الاستجابة (المتوسط) 1.21s
#89	Gemini 3 Flash Preview none	Google	8.3	6.8	$0.085	3/4	1.25s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.085 زمن الاستجابة (المتوسط) 1.25s
#83	GPT-5.6 Sol none	OpenAI	8.3	6.9	$0.524	3/4	1.27s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.524 زمن الاستجابة (المتوسط) 1.27s

ترتيب حيل مضادة للذكاء الاصطناعي

تصفية النماذج

أفضل النماذج حسب درجة حيل مضادة للذكاء الاصطناعي

درجة حيل مضادة للذكاء الاصطناعي مقابل إجمالي التكلفة

أفضل النماذج حسب زمن الاستجابة (المتوسط)