ترتيب النماذج لفئة معلومات عامة

فئة AI BENCHY

اكتشف أي نماذج الذكاء الاصطناعي تؤدي أفضل في معلومات عامة، وأيها يظل أكثر اعتمادية، وأين تظهر أكبر الفجوات. الترتيب حسب: زمن الاستجابة (المتوسط) ↑.

النماذج المعروضة

متوسط درجة معلومات عامة

3.1

أفضل نموذج

Grok 4.20 Beta 0.0

أسباب الفشل

مع سبب الفشل إجابة خاطئة133 مع سبب الفشل خطأ API13 مع سبب الفشل لا توجد إجابة8

169/169

الترتيب	النموذج	الشركة	درجة معلومات عامة	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#131	North Mini Code none	Cohere	3.0	5.1	$0.000	0/1	37.4s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 37.4s
#9	GPT-5.5 medium	OpenAI	2.8	9.0	$3.679	0/1	37.9s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $3.679 زمن الاستجابة (المتوسط) 37.9s
#26	Nemotron 3 Ultra 550b A55b medium	NVIDIA	3.0	8.1	$0.158	0/1	38.5s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.158 زمن الاستجابة (المتوسط) 38.5s
#54	Hy3 preview medium	Tencent	3.0	7.3	$0.021	0/1	39.9s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.021 زمن الاستجابة (المتوسط) 39.9s
#21	GLM 5 Turbo medium	Z.ai	3.0	8.4	$0.323	0/1	40.2s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.323 زمن الاستجابة (المتوسط) 40.2s
#56	GLM 5V Turbo medium	Z.ai	3.0	7.3	$0.457	0/1	41.0s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.457 زمن الاستجابة (المتوسط) 41.0s
#86	Hy3 preview low	Tencent	3.0	6.4	$0.018	0/1	41.7s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.018 زمن الاستجابة (المتوسط) 41.7s
#37	Grok 4.3 medium	X AI	3.0	7.7	$0.614	0/1	44.5s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.614 زمن الاستجابة (المتوسط) 44.5s
#164	gpt-oss-120b none	OpenAI	3.0	4.0	$0.010	0/1	47.3s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.010 زمن الاستجابة (المتوسط) 47.3s
#30	Qwen3.6 Plus medium	Qwen	3.0	7.8	$0.294	0/1	47.5s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.294 زمن الاستجابة (المتوسط) 47.5s
#74	Hy3 preview high	Tencent	3.0	6.8	$0.059	0/1	47.7s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.059 زمن الاستجابة (المتوسط) 47.7s
#18	Seed-2.0-Lite medium	Bytedance Seed	3.0	8.5	$0.175	0/1	48.3s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.175 زمن الاستجابة (المتوسط) 48.3s
#70	Qwen3.5-Flash medium	Qwen	3.0	6.8	$0.080	0/1	49.0s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.080 زمن الاستجابة (المتوسط) 49.0s
#76	MiMo-V2.5 medium	Xiaomi	3.0	6.7	$0.063	0/1	51.3s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.063 زمن الاستجابة (المتوسط) 51.3s
#36	Qwen3.5-122B-A10B medium	Qwen	3.0	7.7	$0.588	0/1	52.9s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.588 زمن الاستجابة (المتوسط) 52.9s

ترتيب معلومات عامة

تصفية النماذج

أفضل النماذج حسب درجة معلومات عامة

درجة معلومات عامة مقابل إجمالي التكلفة

أفضل النماذج حسب زمن الاستجابة (المتوسط)