ترتيب النماذج لفئة الذكاء العام

اكتشف أي نماذج الذكاء الاصطناعي تؤدي أفضل في الذكاء العام، وأيها يظل أكثر اعتمادية، وأين تظهر أكبر الفجوات. الترتيب حسب: اختبارات صحيحة ↑.

النماذج المعروضة

متوسط درجة الذكاء العام

6.1

أفضل نموذج

Grok 4.5 4.7

أسباب الفشل

مع سبب الفشل لم يتبع التعليمات78 مع سبب الفشل إجابة خاطئة62 مع سبب الفشل خطأ API12 مع سبب الفشل انتهت المهلة4

216/216

الترتيب	النموذج	الشركة	درجة الذكاء العام	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#148	Qwen3.5-122B-A10B none	Qwen	5.0	5.7	$0.247	0/1	1.12s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.247 زمن الاستجابة (المتوسط) 1.12s
#149	Gemini 3.1 Flash Lite high	Google	5.0	5.6	$2.044	0/1	45.7s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $2.044 زمن الاستجابة (المتوسط) 45.7s
#150	KAT-Coder-Air V2.5 high	Kwaipilot	5.1	5.6	$0.077	0/1	7.10s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.077 زمن الاستجابة (المتوسط) 7.10s
#151	GLM 5V Turbo none	Z.ai	4.6	5.6	$0.052	0/1	2.22s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.052 زمن الاستجابة (المتوسط) 2.22s
#152	Owl Alpha medium	Openrouter	4.3	5.6	$0.000	0/1	58.6s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 58.6s
#153	Mimo V2 PRO none	Xiaomi	4.3	5.6	$0.045	0/1	2.44s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.045 زمن الاستجابة (المتوسط) 2.44s
#154	Owl Alpha none	Openrouter	4.3	5.6	$0.000	0/1	4.61s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 4.61s
#155	KAT-Coder-Air V2.5 medium	Kwaipilot	5.0	5.6	$0.048	0/1	9.81s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.048 زمن الاستجابة (المتوسط) 9.81s
#156	DeepSeek V4 Flash none	DeepSeek	4.2	5.6	$0.042	0/1	23.7s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.042 زمن الاستجابة (المتوسط) 23.7s
#157	GLM 5.1 none	Z.ai	5.0	5.5	$0.164	0/1	790ms
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.164 زمن الاستجابة (المتوسط) 790ms
#158	Qwen3.6 27B none	Qwen	5.2	5.5	$0.087	0/1	1.07s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.087 زمن الاستجابة (المتوسط) 1.07s
#159	Hy3 preview low	Tencent	3.0	5.5	$0.015	0/1	0ms
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.015 زمن الاستجابة (المتوسط) 0ms
#160	MiMo-V2.5-Pro none	Xiaomi	4.0	5.5	$0.068	0/1	2.58s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.068 زمن الاستجابة (المتوسط) 2.58s
#162	Gemma 4 26B A4B none	Google	4.0	5.5	$0.015	0/1	3.54s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.015 زمن الاستجابة (المتوسط) 3.54s
#163	Mimo V2 Omni none	Xiaomi	4.1	5.5	$0.021	0/1	2.33s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.021 زمن الاستجابة (المتوسط) 2.33s

ترتيب الذكاء العام

تصفية النماذج

أفضل النماذج حسب درجة الذكاء العام

درجة الذكاء العام مقابل إجمالي التكلفة

أفضل النماذج حسب زمن الاستجابة (المتوسط)