ترتيب النماذج لفئة معلومات عامة

فئة AI BENCHY

اكتشف أي نماذج الذكاء الاصطناعي تؤدي أفضل في معلومات عامة، وأيها يظل أكثر اعتمادية، وأين تظهر أكبر الفجوات. الترتيب حسب: زمن الاستجابة (المتوسط) ↓.

النماذج المعروضة

متوسط درجة معلومات عامة

3.1

أفضل نموذج

Kimi K2.7 Code 3.0

أسباب الفشل

مع سبب الفشل إجابة خاطئة133 مع سبب الفشل خطأ API13 مع سبب الفشل لا توجد إجابة8

169/169

الترتيب	النموذج	الشركة	درجة معلومات عامة	النتيجة	إجمالي التكلفة	اختبارات صحيحة	زمن الاستجابة (المتوسط)
#12	Claude Opus 4.8 medium	Anthropic	3.0	8.8	$1.107	0/1	6.14s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $1.107 زمن الاستجابة (المتوسط) 6.14s
#133	Mistral Small 4 medium	Mistral	3.0	5.1	$0.068	0/1	5.92s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.068 زمن الاستجابة (المتوسط) 5.92s
#58	DeepSeek V4 Pro none	DeepSeek	3.0	7.2	$0.034	0/1	5.76s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.034 زمن الاستجابة (المتوسط) 5.76s
#2	Gemini 3 Flash Preview medium	Google	10.0	9.6	$0.667	1/1	5.50s
إجمالي الاختبارات 1 الاختبارات الخاطئة 0 إجمالي التكلفة $0.667 زمن الاستجابة (المتوسط) 5.50s
#90	GPT-5.5 none	OpenAI	3.0	6.3	$0.231	0/1	5.01s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.231 زمن الاستجابة (المتوسط) 5.01s
#66	Gemini 3.5 Flash none	Google	2.8	7.0	$1.079	0/1	4.87s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $1.079 زمن الاستجابة (المتوسط) 4.87s
#46	GPT-5.4 Nano medium	OpenAI	3.0	7.5	$0.107	0/1	4.81s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.107 زمن الاستجابة (المتوسط) 4.81s
#55	Claude Sonnet 4.6 none	Anthropic	3.0	7.3	$0.316	0/1	4.67s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.316 زمن الاستجابة (المتوسط) 4.67s
#45	GPT-5.3 Chat none	OpenAI	3.0	7.5	$0.433	0/1	4.38s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.433 زمن الاستجابة (المتوسط) 4.38s
#120	Qwen3.6 27B none	Qwen	3.0	5.5	$0.028	0/1	4.03s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.028 زمن الاستجابة (المتوسط) 4.03s
#1	Gemini 3.5 Flash high	Google	10.0	9.8	$1.115	1/1	3.94s
إجمالي الاختبارات 1 الاختبارات الخاطئة 0 إجمالي التكلفة $1.115 زمن الاستجابة (المتوسط) 3.94s
#118	Kimi K2.5 none	Moonshot AI	3.0	5.5	$0.027	0/1	3.90s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.027 زمن الاستجابة (المتوسط) 3.90s
#134	MiMo-V2.5 none	Xiaomi	3.0	5.1	$0.007	0/1	3.89s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.007 زمن الاستجابة (المتوسط) 3.89s
#101	GLM 5 none	Z.ai	3.0	6.0	$0.027	0/1	3.62s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.027 زمن الاستجابة (المتوسط) 3.62s
#57	Claude Opus 4.8 none	Anthropic	3.0	7.2	$0.539	0/1	3.41s
إجمالي الاختبارات 1 الاختبارات الخاطئة 1 إجمالي التكلفة $0.539 زمن الاستجابة (المتوسط) 3.41s

ترتيب معلومات عامة

تصفية النماذج

أفضل النماذج حسب درجة معلومات عامة

درجة معلومات عامة مقابل إجمالي التكلفة

أفضل النماذج حسب زمن الاستجابة (المتوسط)