ترتيب النماذج لفئة الذكاء العام

اكتشف أي نماذج الذكاء الاصطناعي تؤدي أفضل في الذكاء العام، وأيها يظل أكثر اعتمادية، وأين تظهر أكبر الفجوات. الترتيب حسب: زمن الاستجابة (المتوسط) ↓.

النماذج المعروضة

متوسط درجة الذكاء العام

6.1

أفضل نموذج

Qwen3.5-9B 2.8

أسباب الفشل

مع سبب الفشل لم يتبع التعليمات78 مع سبب الفشل إجابة خاطئة59 مع سبب الفشل خطأ API12 مع سبب الفشل انتهت المهلة4

210/210

الترتيب	النموذج	الشركة	درجة الذكاء العام	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#19	Qwen3.6 Max Preview medium	Qwen	10.0	8.4	$1.143	1/1	32.2s
إجمالي الاختبارات 1 الاختبارات الخاطئة 0 إجمالي التكلفة $1.143 زمن الاستجابة (المتوسط) 32.2s
#119	Qwen3.5-35B-A3B medium	Qwen	2.8	6.2	$0.837	0/1	30.3s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.837 زمن الاستجابة (المتوسط) 30.3s
#95	Gemma 4 26B A4B medium	Google	10.0	6.6	$0.089	1/1	29.8s
إجمالي الاختبارات 1 الاختبارات الخاطئة 0 إجمالي التكلفة $0.089 زمن الاستجابة (المتوسط) 29.8s
#37	Qwen3.6 Plus medium	Qwen	5.1	7.8	$0.405	0/1	27.1s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.405 زمن الاستجابة (المتوسط) 27.1s
#36	Qwen3.7 Plus medium	Qwen	10.0	7.9	$0.267	1/1	25.5s
إجمالي الاختبارات 1 الاختبارات الخاطئة 0 إجمالي التكلفة $0.267 زمن الاستجابة (المتوسط) 25.5s
#70	Qwen3.5 Plus 2026-04-20 medium	Qwen	4.9	7.2	$0.317	0/1	25.3s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.317 زمن الاستجابة (المتوسط) 25.3s
#45	DeepSeek V4 Flash high	DeepSeek	6.1	7.7	$0.042	0/1	25.2s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.042 زمن الاستجابة (المتوسط) 25.2s
#137	North Mini Code medium	Cohere	5.1	5.9	$0.000	0/1	25.1s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 25.1s
#73	Grok 4.3 medium	X AI	5.4	7.1	$0.779	0/1	24.7s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.779 زمن الاستجابة (المتوسط) 24.7s
#75	Grok 4.20 medium	X AI	3.9	7.1	$0.777	0/1	24.5s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.777 زمن الاستجابة (المتوسط) 24.5s
#150	DeepSeek V4 Flash none	DeepSeek	4.2	5.6	$0.044	0/1	23.7s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.044 زمن الاستجابة (المتوسط) 23.7s
#188	Cobuddy medium	Baidu	4.2	4.7	$0.000	0/1	23.2s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 23.2s
#91	LongCat 2.0 low	Meituan	3.4	6.7	$0.391	0/1	22.5s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.391 زمن الاستجابة (المتوسط) 22.5s
#130	Step 3.5 Flash medium	Stepfun	5.5	6.0	$0.108	0/1	22.4s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.108 زمن الاستجابة (المتوسط) 22.4s
#74	GLM 5.1 medium	Z.ai	10.0	7.1	$0.535	1/1	20.9s
إجمالي الاختبارات 1 الاختبارات الخاطئة 0 إجمالي التكلفة $0.535 زمن الاستجابة (المتوسط) 20.9s

ترتيب الذكاء العام

تصفية النماذج

أفضل النماذج حسب درجة الذكاء العام

درجة الذكاء العام مقابل إجمالي التكلفة

أفضل النماذج حسب زمن الاستجابة (المتوسط)