التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.2 Chat vs Qwen: Qwen3.6 35B A3B

الملخص

مقارنة benchmark بين GPT-5.2 Chat و Qwen3.6 35B A3B: يتقدم GPT-5.2 Chat في متوسط النتيجة بـ 7.9 مقابل 7.4. لدى Qwen3.6 35B A3B تكلفة benchmark أقل عند $0.146 مقابل $0.393. GPT-5.2 Chat أسرع عند 7.13s مقابل 18.08s، مع معدلات نجاح 74.6% مقابل 63.5%.

النموذج الموصى به: Qwen3.6 35B A3B - Its score stays close to the best score here (7.4 vs 7.9), while costing about 2.7x less than GPT-5.2 Chat.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-10

المقياس GPT-5.2 Chat GPT-5.2 Chat none الإصدار: 2025-12-11 Qwen3.6 35B A3B Qwen3.6 35B A3B medium الإصدار: 2026-04-20
النتيجة 7.9 7.4
الترتيب #25 #47
الموثوقية 10.0 10.0
الاتساق 8.9 9.6
اختبارات صحيحة
معدل النجاح لكل محاولة 74.6% 63.5%
اختبارات غير مستقرة 3 1
إجمالي مرات التشغيل 63 63
التكلفة لكل نتيجة 2.803 1.094
إجمالي التكلفة $0.393 $0.146
سعر الإدخال $1.750 / 1M $0.140 / 1M
سعر الإخراج $14.000 / 1M $1.000 / 1M
إجمالي رموز الإدخال 34,212 16,385
رموز الإخراج 23,744 19,632
رموز الاستدلال 0 130,219
زمن الاستجابة (المتوسط) 7.13s 18.08s
زمن الاستجابة (الحد الأقصى) 38.52s 86.11s
زمن الاستجابة (الإجمالي) 149.69s 343.61s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#25 GPT-5.2 Chat

none
Cost
$0.010
Time
15.3s
Tokens
797 tok

#47 Qwen3.6 35B A3B

medium
Invalid SVG
Cost
$0.000
Time
300.0s
Tokens
0 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.2 Chat 8.7 7.9 91.7% 1 3.40s 606 1,807 0
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 6.02s 672 1,154 12,385
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.2 Chat 8.8 7.8 88.9% 1 9.82s 7,305 6,731 0
Qwen3.6 35B A3B 7.7 10.0 66.7% 0 50.55s 5,051 7,929 37,223
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 11,019 1,243 0
Qwen3.6 35B A3B 3.0 10.0 0.0% 0 0ms 0 0 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.05s 7,140 980 0
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 12.99s 7,776 2,591 9,968
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.2 Chat 5.3 10.0 33.3% 0 17.78s 723 7,810 0
Qwen3.6 35B A3B 5.3 7.2 44.4% 1 22.50s 771 6,193 39,116
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.2 Chat 4.4 3.0 33.3% 1 3.20s 477 335 0
Qwen3.6 35B A3B 4.4 9.9 0.0% 0 8.66s 516 129 4,569
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.2 Chat 9.8 10.0 100.0% 0 5.51s 660 1,441 0
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 7.50s 699 219 7,404
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.2 Chat 7.7 10.0 66.7% 0 4.10s 642 1,603 0
Qwen3.6 35B A3B 8.0 10.0 66.7% 0 5.95s 696 655 9,228
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 5,445 555 0
Qwen3.6 35B A3B 3.0 10.0 0.0% 0 0ms 0 0 0
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.2 Chat 3.0 10.0 0.0% 0 6.89s 195 1,239 0
Qwen3.6 35B A3B 3.0 10.0 0.0% 0 32.90s 204 762 10,326

مقارنة سريعة

تبديل زوج المقارنة