التنقل
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.5 vs Qwen: Qwen3.5-35B-A3B

الملخص

مقارنة benchmark بين GPT-5.5 و Qwen3.5-35B-A3B: متوسط النتيجة متقارب جدًا عند 6.3 مقابل 6.3. لدى GPT-5.5 تكلفة benchmark أقل عند $0.231 مقابل $0.401. GPT-5.5 أسرع عند 1.89s مقابل 72.57s، مع معدلات نجاح 54.0% مقابل 69.8%.

النموذج الموصى به: GPT-5.5 - It has the best score here (6.3), while costing about 1.7x less than Qwen3.5-35B-A3B.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-12

المقياس GPT-5.5 GPT-5.5 none الإصدار: 2026-04-24 Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium الإصدار: 2026-02-24
النتيجة 6.3 6.3
الترتيب #89 #88
الموثوقية 10.0 10.0
الاتساق 8.8 7.5
اختبارات صحيحة
معدل النجاح لكل محاولة 54.0% 69.8%
اختبارات غير مستقرة 3 6
إجمالي مرات التشغيل 63 63
التكلفة لكل نتيجة 2.302 5.162
إجمالي التكلفة $0.231 $0.401
سعر الإدخال $5.000 / 1M $0.140 / 1M
سعر الإخراج $30.000 / 1M $1.000 / 1M
إجمالي رموز الإدخال 34,212 42,196
رموز الإخراج 1,971 40,630
رموز الاستدلال 0 353,577
زمن الاستجابة (المتوسط) 1.89s 72.57s
زمن الاستجابة (الحد الأقصى) 5.56s 409.98s
زمن الاستجابة (الإجمالي) 39.64s 1524.04s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#89 GPT-5.5

none
Cost
$0.090
Time
54.3s
Tokens
3,063 tok

#88 Qwen3.5-35B-A3B

medium
Cost
$0.009
Time
71.4s
Tokens
8,631 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.5 6.9 7.9 66.7% 1 1.31s 606 213 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 21.13s 672 798 42,652
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.5 5.5 10.0 33.3% 0 1.35s 7,305 462 0
Qwen3.5-35B-A3B 5.9 9.3 33.3% 0 206.65s 4,106 23,844 111,462
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.5 3.0 10.0 0.0% 0 5.56s 11,019 300 0
Qwen3.5-35B-A3B 4.7 1.6 66.7% 1 75.34s 20,992 775 12,485
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.5 10.0 10.0 100.0% 0 1.18s 7,140 222 0
Qwen3.5-35B-A3B 7.3 5.9 83.3% 1 59.33s 6,061 235 19,493
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.5 2.9 7.2 11.1% 1 1.31s 723 52 0
Qwen3.5-35B-A3B 4.1 4.4 44.5% 2 88.34s 500 41 46,368
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.5 10.0 10.0 100.0% 0 3.41s 477 124 0
Qwen3.5-35B-A3B 2.8 1.6 33.3% 1 30.30s 172 20 3,753
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.5 6.2 5.8 66.7% 1 1.15s 660 81 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 24.45s 699 97 17,361
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.5 7.7 10.0 66.7% 0 1.29s 642 252 0
Qwen3.5-35B-A3B 8.2 7.2 88.9% 1 33.13s 597 3,592 26,585
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.5 10.0 10.0 100.0% 0 3.90s 5,445 247 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 4.65s 8,193 309 1,365
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
GPT-5.5 3.0 10.0 0.0% 0 5.01s 195 18 0
Qwen3.5-35B-A3B 3.0 10.0 0.0% 0 177.35s 204 10,919 72,053

مقارنة سريعة

تبديل زوج المقارنة