التنقل
AI BENCHY
Advertise here

AI BENCHY Compare

Poolside: Laguna XS 2.1 vs Qwen: Qwen3.7 Max

الملخص

مقارنة benchmark بين Laguna XS 2.1 و Qwen3.7 Max: يتقدم Laguna XS 2.1 في متوسط النتيجة بـ 7.0 مقابل 6.9. لدى Laguna XS 2.1 تكلفة benchmark أقل عند $0.036 مقابل $0.054. Qwen3.7 Max أسرع عند 1.30s مقابل 30.08s، مع معدلات نجاح 44.4% مقابل 66.7%.

النموذج الموصى به: Qwen3.7 Max - Its score stays close to the best score here (6.9 vs 7.0), while responding about 23.2x faster than Laguna XS 2.1.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-07-02

المقياس Laguna XS 2.1 Laguna XS 2.1 medium الإصدار: 2026-07-02 متاح مجانًا Qwen3.7 Max Qwen3.7 Max none الإصدار: 2026-05-22
النتيجة 7.0 6.9
الترتيب #67 #71
الموثوقية 10.0 10.0
الاتساق 9.6 10.0
اختبارات صحيحة
معدل النجاح لكل محاولة 44.4% 66.7%
اختبارات غير مستقرة 1 0
إجمالي مرات التشغيل 63 63
التكلفة لكل نتيجة 0.392 0.744
إجمالي التكلفة $0.036 $0.054
سعر الإدخال $0.060 / 1M $1.250 / 1M
سعر الإخراج $0.120 / 1M $3.750 / 1M
إجمالي رموز الإدخال 45,324 37,107
رموز الإخراج 25,761 1,994
رموز الاستدلال 268,677 0
زمن الاستجابة (المتوسط) 30.08s 1.30s
زمن الاستجابة (الحد الأقصى) 155.23s 3.92s
زمن الاستجابة (الإجمالي) 631.77s 27.21s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#67 Laguna XS 2.1

medium
التكلفة
$0.001
الوقت
30.6s
الرموز
4,678 tok

#71 Qwen3.7 Max

none
التكلفة
$0.046
الوقت
195.0s
الرموز
12,171 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Laguna XS 2.1 4.8 10.0 25.0% 0 41.96s 774 353 73,090
Qwen3.7 Max 6.5 10.0 50.0% 0 1.08s 696 242 0
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Laguna XS 2.1 5.5 10.0 33.3% 0 70.35s 7,995 23,767 83,258
Qwen3.7 Max 5.5 10.0 33.3% 0 1.35s 7,911 582 0
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Laguna XS 2.1 9.6 10.0 100.0% 0 13.43s 18,033 507 5,908
Qwen3.7 Max 3.0 10.0 0.0% 0 2.17s 9,549 171 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Laguna XS 2.1 10.0 10.0 100.0% 0 4.50s 7,734 234 3,129
Qwen3.7 Max 10.0 10.0 100.0% 0 1.35s 7,794 243 0
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Laguna XS 2.1 2.9 7.2 11.1% 1 65.66s 834 17 91,533
Qwen3.7 Max 7.7 10.0 66.7% 0 975ms 789 15 0
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Laguna XS 2.1 5.0 10.0 0.0% 0 4.15s 537 119 1,375
Qwen3.7 Max 10.0 10.0 100.0% 0 1.04s 522 120 0
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Laguna XS 2.1 9.8 10.0 100.0% 0 2.57s 753 82 1,844
Qwen3.7 Max 10.0 10.0 100.0% 0 943ms 711 72 0
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Laguna XS 2.1 5.3 10.0 33.3% 0 3.43s 771 357 3,355
Qwen3.7 Max 10.0 10.0 100.0% 0 1.13s 714 314 0
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Laguna XS 2.1 10.0 10.0 100.0% 0 3.01s 7,638 309 748
Qwen3.7 Max 10.0 10.0 100.0% 0 3.92s 8,211 222 0
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Laguna XS 2.1 3.0 10.0 0.0% 0 10.88s 255 16 4,437
Qwen3.7 Max 3.0 10.0 0.0% 0 856ms 210 13 0

مقارنة سريعة

تبديل زوج المقارنة