ترتيب النماذج لفئة معلومات عامة

فئة AI BENCHY

اكتشف أي نماذج الذكاء الاصطناعي تؤدي أفضل في معلومات عامة، وأيها يظل أكثر اعتمادية، وأين تظهر أكبر الفجوات. الترتيب حسب: اختبارات صحيحة ↑.

النماذج المعروضة

متوسط درجة معلومات عامة

3.1

أفضل نموذج

Qwen3.7 Max 3.0

أسباب الفشل

مع سبب الفشل إجابة خاطئة133 مع سبب الفشل خطأ API13 مع سبب الفشل لا توجد إجابة8

169/169

الترتيب	النموذج	الشركة	درجة معلومات عامة	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#3	Qwen3.7 Max medium	Qwen	3.0	9.4	$0.523	0/1	33.4s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.523 زمن الاستجابة (المتوسط) 33.4s
#4	GPT-5.5 low	OpenAI	3.0	9.3	$0.907	0/1	10.1s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.907 زمن الاستجابة (المتوسط) 10.1s
#6	Claude Fable 5 medium	Anthropic	3.0	9.2	$3.165	0/1	25.6s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $3.165 زمن الاستجابة (المتوسط) 25.6s
#9	GPT-5.5 medium	OpenAI	2.8	9.0	$3.679	0/1	37.9s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $3.679 زمن الاستجابة (المتوسط) 37.9s
#10	GPT-5.3-Codex medium	OpenAI	2.8	8.9	$0.740	0/1	14.4s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.740 زمن الاستجابة (المتوسط) 14.4s
#11	Qwen3.6 Max Preview medium	Qwen	3.0	8.9	$0.960	0/1	60.6s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.960 زمن الاستجابة (المتوسط) 60.6s
#12	Claude Opus 4.8 medium	Anthropic	3.0	8.8	$1.107	0/1	6.14s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $1.107 زمن الاستجابة (المتوسط) 6.14s
#13	Claude Opus 4.7 medium	Anthropic	3.0	8.7	$0.679	0/1	2.25s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.679 زمن الاستجابة (المتوسط) 2.25s
#14	GLM 5.2 medium	Z.ai	3.0	8.7	$0.324	0/1	34.2s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.324 زمن الاستجابة (المتوسط) 34.2s
#15	GLM 5 medium	Z.ai	3.0	8.6	$0.228	0/1	67.4s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.228 زمن الاستجابة (المتوسط) 67.4s
#16	GPT-5 Mini medium	OpenAI	3.0	8.5	$0.159	0/1	9.99s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.159 زمن الاستجابة (المتوسط) 9.99s
#17	GPT-5.4 medium	OpenAI	3.0	8.5	$1.210	0/1	14.0s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $1.210 زمن الاستجابة (المتوسط) 14.0s
#18	Seed-2.0-Lite medium	Bytedance Seed	3.0	8.5	$0.175	0/1	48.3s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.175 زمن الاستجابة (المتوسط) 48.3s
#19	GPT-5.2 Chat none	OpenAI	3.0	8.5	$0.393	0/1	6.89s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.393 زمن الاستجابة (المتوسط) 6.89s
#20	Step 3.7 Flash medium	Stepfun	3.0	8.5	$0.376	0/1	114.0s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.376 زمن الاستجابة (المتوسط) 114.0s

ترتيب معلومات عامة

تصفية النماذج

أفضل النماذج حسب درجة معلومات عامة

درجة معلومات عامة مقابل إجمالي التكلفة

أفضل النماذج حسب زمن الاستجابة (المتوسط)