قارن الرسوم البيانية

اللغة:

❤️ Made by XCS

AI BENCHY Compare

OpenAI: GPT-5 Mini vs Qwen: Qwen3.5-35B-A3B

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03

المقياس	OpenAI: GPT-5 Mini medium الإصدار: 2025-08-07	Qwen: Qwen3.5-35B-A3B medium الإصدار: 2026-02-24
الترتيب	#33	#30
متوسط الدرجة	5.77	5.93
الاتساق	8.79	6.62
التكلفة لكل نتيجة	1.200	5.169
إجمالي التكلفة	$0.084	$0.362
اختبارات صحيحة
معدل النجاح لكل محاولة	57.1%	73.8%
اختبارات غير مستقرة	2	6
رموز الإخراج	4,723	1,317
رموز الاستدلال	35,392	177,502

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5 Mini	7.00	9.62	66.7%	0		1,645	5,824
Qwen: Qwen3.5-35B-A3B	10.00	10.00	100.0%	0		429	36,235

تحليل البيانات واستخراجها	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5 Mini	9.88	10.00	100.0%	0		453	3,200
Qwen: Qwen3.5-35B-A3B	5.50	5.87	83.3%	1		235	19,493

خاص بالمجال	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5 Mini	1.00	7.21	22.2%	1		293	14,016
Qwen: Qwen3.5-35B-A3B	1.00	4.41	44.5%	2		41	46,368

اتباع التعليمات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5 Mini	7.00	6.64	66.7%	1		318	4,992
Qwen: Qwen3.5-35B-A3B	8.00	6.80	66.7%	1		97	17,361

Puzzle Solving	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5 Mini	4.33	9.78	33.3%	0		1,527	5,760
Qwen: Qwen3.5-35B-A3B	4.33	4.70	66.7%	2		206	56,680

استدعاء الأدوات	النتيجة	الاتساق	معدل النجاح لكل محاولة	اختبارات غير مستقرة	اختبارات صحيحة	رموز الإخراج	رموز الاستدلال
OpenAI: GPT-5 Mini	10.00	10.00	100.0%	0		487	1,600
Qwen: Qwen3.5-35B-A3B	10.00	10.00	100.0%	0		309	1,365

مقارنة سريعة

تبديل زوج المقارنة

Qwen3.5-35B-A3BmediumvsGLM 5none GPT-5 MinimediumvsGLM 5none Claude Sonnet 4.6nonevsQwen3.5-35B-A3Bmedium Gemini 2.5 FlashnonevsGPT-5 Minimedium GPT-5 MinimediumvsQwen3.5 Plus 2026-02-15none GPT-5 MinimediumvsQwen3.5-122B-A10Bnone Claude Sonnet 4.6nonevsGPT-5 Minimedium Gemini 2.5 FlashnonevsQwen3.5-35B-A3Bmedium DeepSeek V3.2nonevsGPT-5 Minimedium GPT-5 MinimediumvsQwen3.5-27Bnone GPT-4o-mininonevsQwen3.5-35B-A3Bmedium GPT-5 MinimediumvsQwen3.5-35B-A3Bnone