التنقل
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemma 4 26B A4B vs Inception: Mercury 2

الملخص

مقارنة benchmark بين Gemma 4 26B A4B و Mercury 2: يتقدم Gemma 4 26B A4B في متوسط النتيجة بـ 5.5 مقابل 4.6. لدى Gemma 4 26B A4B تكلفة benchmark أقل عند $0.004 مقابل $0.011. Mercury 2 أسرع عند 653ms مقابل 5.91s، مع معدلات نجاح 44.4% مقابل 23.8%.

النموذج الموصى به: Gemma 4 26B A4B - It has the best score here (5.5), while costing about 3.4x less than Mercury 2.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-18

المقياس Gemma 4 26B A4B Gemma 4 26B A4B none الإصدار: 2026-04-03 متاح مجانًا Mercury 2 Mercury 2 none الإصدار: 2026-02-24
النتيجة 5.5 4.6
الترتيب #121 #151
الموثوقية 10.0 10.0
الاتساق 9.2 9.2
اختبارات صحيحة
معدل النجاح لكل محاولة 44.4% 23.8%
اختبارات غير مستقرة 2 2
إجمالي مرات التشغيل 63 63
التكلفة لكل نتيجة 0.068 0.259
إجمالي التكلفة $0.004 $0.011
سعر الإدخال $0.060 / 1M $0.250 / 1M
سعر الإخراج $0.330 / 1M $0.750 / 1M
إجمالي رموز الإدخال 40,038 28,113
رموز الإخراج 1,824 4,439
رموز الاستدلال 0 0
زمن الاستجابة (المتوسط) 5.91s 653ms
زمن الاستجابة (الحد الأقصى) 57.10s 1.43s
زمن الاستجابة (الإجمالي) 124.05s 13.72s

عرض إنشاء

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#121 Gemma 4 26B A4B

none
التكلفة
$0.001
الوقت
39.5s
الرموز
790 tok

#151 Mercury 2

none
التكلفة
$0.002
الوقت
1.8s
الرموز
1,514 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 26B A4B 8.3 10.0 75.0% 0 1.28s 852 230 0
Mercury 2 3.0 10.0 0.0% 0 483ms 631 286 0
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 26B A4B 3.7 7.2 22.2% 1 4.16s 7,736 476 0
Mercury 2 3.4 9.6 0.0% 0 1.03s 7,229 3,088 0
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 26B A4B 3.0 10.0 0.0% 0 30.53s 13,650 309 0
Mercury 2 3.0 10.0 0.0% 0 606ms 4,821 131 0
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 26B A4B 10.0 10.0 100.0% 0 1.70s 8,352 285 0
Mercury 2 7.3 5.9 83.3% 1 667ms 6,362 180 0
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 26B A4B 3.6 7.2 22.2% 1 2.49s 903 27 0
Mercury 2 5.3 7.2 44.4% 1 534ms 784 46 0
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 26B A4B 4.0 10.0 0.0% 0 3.54s 576 85 0
Mercury 2 4.8 10.0 0.0% 0 628ms 495 159 0
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 26B A4B 6.3 10.0 50.0% 0 690ms 795 75 0
Mercury 2 6.5 10.0 50.0% 0 551ms 691 82 0
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 26B A4B 6.2 10.0 33.3% 0 744ms 828 114 0
Mercury 2 3.1 10.0 0.0% 0 535ms 694 251 0
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 26B A4B 10.0 10.0 100.0% 0 57.10s 6,123 210 0
Mercury 2 10.0 10.0 100.0% 0 1.27s 6,193 197 0
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Gemma 4 26B A4B 3.0 10.0 0.0% 0 778ms 223 13 0
Mercury 2 3.0 10.0 0.0% 0 548ms 213 19 0

مقارنة سريعة

تبديل زوج المقارنة