ترتيب النماذج لفئة حيل مضادة للذكاء الاصطناعي

اكتشف أي نماذج الذكاء الاصطناعي تؤدي أفضل في حيل مضادة للذكاء الاصطناعي، وأيها يظل أكثر اعتمادية، وأين تظهر أكبر الفجوات. الترتيب حسب: المقياس ↑.

النماذج المعروضة

متوسط درجة حيل مضادة للذكاء الاصطناعي

7.2

أفضل نموذج

LFM2-24B-A2B 2.5

أسباب الفشل

مع سبب الفشل إجابة خاطئة293 مع سبب الفشل لم يتبع التعليمات33 مع سبب الفشل تنسيق إضافي20 مع سبب الفشل خطأ API14 مع سبب الفشل انتهت المهلة4 مع سبب الفشل لا توجد إجابة4

216/216

الترتيب	النموذج	الشركة	درجة حيل مضادة للذكاء الاصطناعي	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#49	DeepSeek V4 Flash high	DeepSeek	8.3	7.7	$0.041	3/4	28.5s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.041 زمن الاستجابة (المتوسط) 28.5s
#52	Grok Build 0.1 medium	X AI	8.3	7.6	$1.097	3/4	7.43s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $1.097 زمن الاستجابة (المتوسط) 7.43s
#54	GPT-5.6 Luna medium	OpenAI	8.3	7.6	$0.352	3/4	2.52s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.352 زمن الاستجابة (المتوسط) 2.52s
#57	GPT-5.4 Nano medium	OpenAI	8.3	7.5	$0.138	3/4	4.52s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.138 زمن الاستجابة (المتوسط) 4.52s
#59	GPT-5.6 Terra low	OpenAI	8.3	7.5	$0.519	3/4	2.36s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.519 زمن الاستجابة (المتوسط) 2.36s
#87	GPT-5.6 Sol none	OpenAI	8.3	6.9	$0.524	3/4	1.27s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.524 زمن الاستجابة (المتوسط) 1.27s
#93	Gemini 3 Flash Preview none	Google	8.3	6.8	$0.085	3/4	1.25s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.085 زمن الاستجابة (المتوسط) 1.25s
#99	Claude Opus 4.7 none	Anthropic	8.3	6.6	$0.505	3/4	2.12s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.505 زمن الاستجابة (المتوسط) 2.12s
#101	GLM 5.2 none	Z.ai	8.3	6.6	$0.128	3/4	3.70s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.128 زمن الاستجابة (المتوسط) 3.70s
#105	Qwen3.6 27B medium	Qwen	8.3	6.5	$0.779	3/4	12.6s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.779 زمن الاستجابة (المتوسط) 12.6s
#110	Gemini 3.1 Flash Lite Preview low	Google	8.3	6.5	$0.646	3/4	2.12s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.646 زمن الاستجابة (المتوسط) 2.12s
#123	GPT-5.6 Luna low	OpenAI	8.3	6.2	$0.249	3/4	2.21s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.249 زمن الاستجابة (المتوسط) 2.21s
#126	Gemini 3.1 Flash Lite minimal	Google	8.3	6.1	$0.047	3/4	1.10s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.047 زمن الاستجابة (المتوسط) 1.10s
#129	Inkling low	Thinkingmachines	8.3	6.1	$0.187	3/4	2.51s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.187 زمن الاستجابة (المتوسط) 2.51s
#146	Nemotron 3 Super medium	NVIDIA	8.3	5.7	$0.055	3/4	7.85s
إجمالي الاختبارات 4 الاختبارات الخاطئة 1 إجمالي التكلفة $0.055 زمن الاستجابة (المتوسط) 7.85s

ترتيب حيل مضادة للذكاء الاصطناعي

تصفية النماذج

أفضل النماذج حسب درجة حيل مضادة للذكاء الاصطناعي

درجة حيل مضادة للذكاء الاصطناعي مقابل إجمالي التكلفة

أفضل النماذج حسب زمن الاستجابة (المتوسط)