التنقل
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.2 vs Qwen: Qwen3.5-Flash

الملخص

مقارنة benchmark بين GPT-5.2 و Qwen3.5-Flash: يتقدم GPT-5.2 في متوسط النتيجة بـ 8.4 مقابل 6.8. لدى Qwen3.5-Flash تكلفة benchmark أقل عند $0.080 مقابل $0.548. GPT-5.2 أسرع عند 16.88s مقابل 63.29s، مع معدلات نجاح 71.4% مقابل 71.4%.

النموذج الموصى به: GPT-5.2 - It has the best score here (8.4), while responding about 3.7x faster than Qwen3.5-Flash.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-18

المقياس GPT-5.2 GPT-5.2 medium الإصدار: 2025-12-11 Qwen3.5-Flash Qwen3.5-Flash medium الإصدار: 2026-02-24
النتيجة 8.4 6.8
الترتيب #22 #70
الموثوقية 10.0 10.0
الاتساق 8.4 8.1
اختبارات صحيحة
معدل النجاح لكل محاولة 71.4% 71.4%
اختبارات غير مستقرة 4 5
إجمالي مرات التشغيل 63 63
التكلفة لكل نتيجة 4.209 0.871
إجمالي التكلفة $0.548 $0.080
سعر الإدخال $1.750 / 1M $0.065 / 1M
سعر الإخراج $14.000 / 1M $0.260 / 1M
إجمالي رموز الإدخال 33,967 38,926
رموز الإخراج 2,901 2,088
رموز الاستدلال 31,932 294,598
زمن الاستجابة (المتوسط) 16.88s 63.29s
زمن الاستجابة (الحد الأقصى) 77.80s 234.29s
زمن الاستجابة (الإجمالي) 236.34s 1265.85s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#22 GPT-5.2

medium
التكلفة
$0.047
الوقت
49.2s
الرموز
3,396 tok

#70 Qwen3.5-Flash

medium
التكلفة
$0.002
الوقت
25.8s
الرموز
4,294 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.2 6.5 8.0 58.3% 1 7.81s 606 567 2,002
Qwen3.5-Flash 10.0 10.0 100.0% 0 59.11s 672 383 32,992
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.2 10.0 10.0 100.0% 0 22.73s 7,302 511 11,912
Qwen3.5-Flash 3.7 7.2 22.2% 1 58.87s 6,685 302 90,081
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.2 10.0 10.0 100.0% 0 14.06s 11,019 291 1,757
Qwen3.5-Flash 10.0 10.0 100.0% 0 17.78s 14,934 483 8,270
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.2 10.0 10.0 100.0% 0 3.15s 7,140 234 420
Qwen3.5-Flash 7.3 5.9 83.3% 1 56.99s 6,061 235 16,237
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.2 5.9 7.2 55.6% 1 77.80s 473 42 10,342
Qwen3.5-Flash 5.3 7.2 44.4% 1 146.50s 581 58 43,615
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.2 3.7 9.7 0.0% 0 4.32s 477 162 269
Qwen3.5-Flash 6.1 3.1 66.7% 1 40.05s 516 99 38,486
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.2 9.9 10.0 100.0% 0 3.12s 660 94 614
Qwen3.5-Flash 10.0 10.0 100.0% 0 63.49s 699 98 14,139
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.2 7.5 7.3 77.8% 1 5.80s 642 735 924
Qwen3.5-Flash 8.2 7.2 88.9% 1 27.61s 381 89 12,457
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.2 4.7 1.6 66.7% 1 10.30s 5,453 239 469
Qwen3.5-Flash 10.0 10.0 100.0% 0 10.33s 8,193 309 1,284
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.2 3.0 10.0 0.0% 0 28.18s 195 26 3,223
Qwen3.5-Flash 3.0 10.0 0.0% 0 48.98s 204 32 37,037

مقارنة سريعة

تبديل زوج المقارنة