ترتيب النماذج لفئة معلومات عامة

فئة AI BENCHY

اكتشف أي نماذج الذكاء الاصطناعي تؤدي أفضل في معلومات عامة، وأيها يظل أكثر اعتمادية، وأين تظهر أكبر الفجوات. الترتيب حسب: المقياس ↑.

النماذج المعروضة

متوسط درجة معلومات عامة

3.1

أفضل نموذج

Grok 4.20 Beta 0.0

أسباب الفشل

مع سبب الفشل إجابة خاطئة133 مع سبب الفشل خطأ API13 مع سبب الفشل لا توجد إجابة8

169/169

الترتيب	النموذج	الشركة	درجة معلومات عامة	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#156	Laguna Xs.2 medium	Poolside	3.0	4.3	$0.000	0/1	0ms
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 0ms
#157	GLM 4.7 Flash medium	Z.ai	3.0	4.3	$0.054	0/1	11.1s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.054 زمن الاستجابة (المتوسط) 11.1s
#158	Hy3 preview none	Tencent	3.0	4.3	$0.003	0/1	2.71s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.003 زمن الاستجابة (المتوسط) 2.71s
#159	MiMo-V2-Flash none	Xiaomi	3.0	4.3	$0.025	0/1	1.82s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.025 زمن الاستجابة (المتوسط) 1.82s
#160	Grok Build 0.1 none	X AI	3.0	4.2	$0.547	0/1	36.1s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.547 زمن الاستجابة (المتوسط) 36.1s
#161	Grok 4.1 Fast none	X AI	3.0	4.0	$0.008	0/1	731ms
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.008 زمن الاستجابة (المتوسط) 731ms
#162	Laguna Xs.2 none	Poolside	3.0	4.0	$0.000	0/1	0ms
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 0ms
#163	Granite 4.1 8B none	IBM Granite	3.0	4.0	$0.003	0/1	306ms
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.003 زمن الاستجابة (المتوسط) 306ms
#164	gpt-oss-120b none	OpenAI	3.0	4.0	$0.010	0/1	47.3s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.010 زمن الاستجابة (المتوسط) 47.3s
#165	Qwen3.5-9B medium	Qwen	3.0	3.8	$0.036	0/1	177.0s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.036 زمن الاستجابة (المتوسط) 177.0s
#166	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	3.0	3.6	$0.000	0/1	0ms
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 0ms
#167	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	3.0	3.5	$0.000	0/1	0ms
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.000 زمن الاستجابة (المتوسط) 0ms
#168	Step 3.5 Flash none	Stepfun	3.0	2.6	$0.020	0/1	114.1s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.020 زمن الاستجابة (المتوسط) 114.1s
#1	Gemini 3.5 Flash high	Google	10.0	9.8	$1.115	1/1	3.94s
إجمالي الاختبارات 1 الاختبارات الخاطئة 0 إجمالي التكلفة $1.115 زمن الاستجابة (المتوسط) 3.94s
#2	Gemini 3 Flash Preview medium	Google	10.0	9.6	$0.667	1/1	5.50s
إجمالي الاختبارات 1 الاختبارات الخاطئة 0 إجمالي التكلفة $0.667 زمن الاستجابة (المتوسط) 5.50s

ترتيب معلومات عامة

تصفية النماذج

أفضل النماذج حسب درجة معلومات عامة

درجة معلومات عامة مقابل إجمالي التكلفة

أفضل النماذج حسب زمن الاستجابة (المتوسط)