التنقل
AI BENCHY
قارن الرسوم البيانية
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.3 Chat vs Qwen: Qwen3.5-122B-A10B

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03

المقياس OpenAI: GPT-5.3 Chat none الإصدار: 2026-03-03 Qwen: Qwen3.5-122B-A10B medium الإصدار: 2026-02-24
الترتيب #14 #21
متوسط الدرجة 7.27 6.77
الاتساق 8.26 8.22
التكلفة لكل نتيجة 2.835 5.137
إجمالي التكلفة $0.256 $0.463
اختبارات صحيحة
معدل النجاح لكل محاولة 73.8% 76.2%
اختبارات غير مستقرة 3 3
رموز الإخراج 16,339 16,751
رموز الاستدلال 0 125,394

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
OpenAI: GPT-5.3 Chat 7.33 7.49 77.8% 1 3,091 0
Qwen: Qwen3.5-122B-A10B 10.00 10.00 100.0% 0 248 10,486
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
OpenAI: GPT-5.3 Chat 9.88 10.00 100.0% 0 942 0
Qwen: Qwen3.5-122B-A10B 9.88 10.00 100.0% 0 270 16,558
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
OpenAI: GPT-5.3 Chat 1.00 4.41 33.3% 2 8,264 0
Qwen: Qwen3.5-122B-A10B 1.00 7.21 11.1% 1 15,537 64,889
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
OpenAI: GPT-5.3 Chat 8.50 9.99 50.0% 0 1,455 0
Qwen: Qwen3.5-122B-A10B 5.50 5.92 83.3% 1 77 7,372
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
OpenAI: GPT-5.3 Chat 10.00 10.00 100.0% 0 1,726 0
Qwen: Qwen3.5-122B-A10B 7.00 7.21 88.9% 1 297 24,863
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة رموز الإخراج رموز الاستدلال
OpenAI: GPT-5.3 Chat 10.00 10.00 100.0% 0 861 0
Qwen: Qwen3.5-122B-A10B 10.00 10.00 100.0% 0 322 1,226

مقارنة سريعة

تبديل زوج المقارنة