التنقل
AI BENCHY
قارن الرسوم البيانية
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 2.5 Flash vs Inception: Mercury 2

قارن:

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-05

المقياس Google: Gemini 2.5 Flash none الإصدار: 2025-06-17 Inception: Mercury 2 medium الإصدار: 2026-02-24
الترتيب #37 #35
متوسط الدرجة 52 54
الاتساق 90 83
التكلفة لكل نتيجة 0.185 0.622
إجمالي التكلفة $0.012 $0.044
زمن الاستجابة (المتوسط) 944ms 2.47s
زمن الاستجابة (الحد الأقصى) 4.39s 14.63s
زمن الاستجابة (الإجمالي) 14.16s 34.56s
اختبارات صحيحة
معدل النجاح لكل محاولة 46.7% 57.8%
اختبارات غير مستقرة 2 3
رموز الإخراج 1,192 3,571
رموز الاستدلال 0 45,379

أفضل النماذج حسب الدرجة

زمن الاستجابة (المتوسط)

الدرجة مقابل التكلفة الإجمالية

متوسط الدرجة vs زمن الاستجابة (المتوسط)

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Google: Gemini 2.5 Flash 100 100 0.0% 0 668ms 99 0
Inception: Mercury 2 73 98 66.7% 0 1.30s 2,531 2,410
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Google: Gemini 2.5 Flash 100 100 0.0% 0 4.39s 366 0
Inception: Mercury 2 100 100 100.0% 0 3.28s 268 4,887
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Google: Gemini 2.5 Flash 99 100 100.0% 0 652ms 279 0
Inception: Mercury 2 55 59 83.3% 1 1.11s 183 1,656
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Google: Gemini 2.5 Flash 40 72 55.6% 1 495ms 12 0
Inception: Mercury 2 100 72 11.1% 1 6.48s 41 30,754
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Google: Gemini 2.5 Flash 90 68 66.7% 1 672ms 70 0
Inception: Mercury 2 100 100 100.0% 0 1.07s 14 958
Puzzle Solving النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Google: Gemini 2.5 Flash 47 100 33.3% 0 576ms 132 0
Inception: Mercury 2 17 75 22.2% 1 934ms 354 2,758
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Google: Gemini 2.5 Flash 100 100 100.0% 0 1.91s 234 0
Inception: Mercury 2 100 100 100.0% 0 1.89s 180 1,956

مقارنة سريعة

تبديل زوج المقارنة