مقارنة benchmark بين DeepSeek V4 Pro و Gemini 3 PRO Preview: يتقدم DeepSeek V4 Pro في متوسط النتيجة بـ 7.6 مقابل 6.2. لدى DeepSeek V4 Pro تكلفة benchmark أقل عند $0.157 مقابل $0.385. Gemini 3 PRO Preview أسرع عند 9.05s مقابل 77.20s، مع معدلات نجاح 66.7% مقابل 66.7%.
النموذج الموصى به: DeepSeek V4 Pro - It has the best score here (7.6), while costing about 2.5x less than Gemini 3 PRO Preview.
تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-18
9.3درجة النجاح من المحاولة الأولى: 10.0 تعني عدم وجود إخفاقات قابلة لإعادة المحاولة من واجهة API الهدف أو حدود المعدل قبل النداءات الناجحة؛ الإخفاقات المسجلة تخفض الدرجة.…
غير متاحدرجة النجاح من المحاولة الأولى: 10.0 تعني عدم وجود إخفاقات قابلة لإعادة المحاولة من واجهة API الهدف أو حدود المعدل قبل النداءات الناجحة؛ الإخفاقات المسجلة تخفض الدرجة.…
الاتساق
7.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.خطأ API: 4إجابة خاطئة: 3زمن الاستجابة (المتوسط)9.05sزمن الاستجابة (الحد الأقصى)26.24sزمن الاستجابة (الإجمالي)90.53sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
معدل النجاح لكل محاولة
66.7%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
66.7%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
اختبارات غير مستقرة
8الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
إجمالي مرات التشغيل
63إجمالي مرات التشغيل…
63إجمالي مرات التشغيل…
التكلفة لكل نتيجة
1.742يعرض متوسط التكلفة لكل إجابة صحيحة في المعيار بالسنت (الأقل أفضل).…
1.406يعرض متوسط التكلفة لكل إجابة صحيحة في المعيار بالسنت (الأقل أفضل).…
إجمالي التكلفة
$0.157إجمالي التكلفة (السعر الحالي)…
$0.385إجمالي التكلفة (السعر الحالي)…
سعر الإدخال
$0.435 / 1Mسعر الإدخال…
$9.506 / 1Mسعر الإدخال…
سعر الإخراج
$0.870 / 1Mسعر الإخراج…
$9.506 / 1Mسعر الإخراج…
إجمالي رموز الإدخال
38,726إجمالي رموز الإدخال…
28,848إجمالي رموز الإدخال…
رموز الإخراج
6,334رموز الإخراج…
1,490رموز الإخراج…
رموز الاستدلال
159,151رموز الاستدلال…
10,102رموز الاستدلال…
زمن الاستجابة (المتوسط)
77.20sزمن الاستجابة (المتوسط)…
9.05sزمن الاستجابة (المتوسط)…
زمن الاستجابة (الحد الأقصى)
416.76sزمن الاستجابة (الحد الأقصى)…
26.24sزمن الاستجابة (الحد الأقصى)…
زمن الاستجابة (الإجمالي)
1621.17sزمن الاستجابة (الإجمالي)…
90.53sزمن الاستجابة (الإجمالي)…
عرض إنشاء
Hamster playing table tennis
Prompt: Create a detailed SVG illustration of a hamster playing table tennis.
#41 DeepSeek V4 Pro
high
التكلفة
$0.023
الوقت
257.6s
الرموز
14,870 tok
#91 Gemini 3 PRO Preview
medium
No endpoints found for google/gemini-3-pro-preview.
5.9تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
58.3%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
2الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 2لا توجد إجابة: 1زمن الاستجابة (المتوسط)25.70sزمن الاستجابة (الحد الأقصى)48.19sزمن الاستجابة (الإجمالي)102.80sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
25.70sزمن الاستجابة (المتوسط)…
536إجمالي رموز الإدخال…
149رموز الإخراج…
3,214رموز الاستدلال…
Gemini 3 PRO Previewنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
10.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)14.99sزمن الاستجابة (الحد الأقصى)26.24sزمن الاستجابة (الإجمالي)29.99sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
4.6تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
66.7%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
2الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.خطأ API: 1انتهت المهلة: 1زمن الاستجابة (المتوسط)243.00sزمن الاستجابة (الحد الأقصى)416.76sزمن الاستجابة (الإجمالي)729.00sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
243.00sزمن الاستجابة (المتوسط)…
5,090إجمالي رموز الإدخال…
383رموز الإخراج…
84,580رموز الاستدلال…
Gemini 3 PRO Previewنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
3.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
0.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.خطأ API: 3زمن الاستجابة (المتوسط)0msزمن الاستجابة (الحد الأقصى)0msزمن الاستجابة (الإجمالي)0msيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)38.17sزمن الاستجابة (الحد الأقصى)38.17sزمن الاستجابة (الإجمالي)38.17sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
38.17sزمن الاستجابة (المتوسط)…
14,060إجمالي رموز الإدخال…
454رموز الإخراج…
5,836رموز الاستدلال…
Gemini 3 PRO Previewنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
3.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
0.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)10.37sزمن الاستجابة (الحد الأقصى)10.37sزمن الاستجابة (الإجمالي)10.37sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)25.03sزمن الاستجابة (الحد الأقصى)27.49sزمن الاستجابة (الإجمالي)50.06sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
25.03sزمن الاستجابة (المتوسط)…
7,690إجمالي رموز الإدخال…
274رموز الإخراج…
2,166رموز الاستدلال…
Gemini 3 PRO Previewنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
10.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)10.84sزمن الاستجابة (الحد الأقصى)10.84sزمن الاستجابة (الإجمالي)10.84sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
7.2تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
22.2%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
1الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 2تنسيق إضافي: 1زمن الاستجابة (المتوسط)151.46sزمن الاستجابة (الحد الأقصى)387.23sزمن الاستجابة (الإجمالي)454.38sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
151.46sزمن الاستجابة (المتوسط)…
569إجمالي رموز الإدخال…
4,404رموز الإخراج…
50,391رموز الاستدلال…
Gemini 3 PRO Previewنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
5.3متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
33.3%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 2زمن الاستجابة (المتوسط)7.01sزمن الاستجابة (الحد الأقصى)7.01sزمن الاستجابة (الإجمالي)7.01sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)8.83sزمن الاستجابة (الحد الأقصى)8.83sزمن الاستجابة (الإجمالي)8.83sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
8.83sزمن الاستجابة (المتوسط)…
471إجمالي رموز الإدخال…
115رموز الإخراج…
1,013رموز الاستدلال…
Gemini 3 PRO Previewنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
10.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)9.34sزمن الاستجابة (الحد الأقصى)9.34sزمن الاستجابة (الإجمالي)9.34sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
6.6تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
83.3%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
1الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1زمن الاستجابة (المتوسط)8.73sزمن الاستجابة (الحد الأقصى)9.53sزمن الاستجابة (الإجمالي)17.45sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
8.73sزمن الاستجابة (المتوسط)…
627إجمالي رموز الإدخال…
66رموز الإخراج…
2,726رموز الاستدلال…
Gemini 3 PRO Previewنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
9.8متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)3.26sزمن الاستجابة (الحد الأقصى)3.26sزمن الاستجابة (الإجمالي)3.26sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
4.9تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
77.8%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
2الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لم يتبع التعليمات: 1إجابة خاطئة: 1زمن الاستجابة (المتوسط)56.85sزمن الاستجابة (الحد الأقصى)146.68sزمن الاستجابة (الإجمالي)170.55sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
56.85sزمن الاستجابة (المتوسط)…
591إجمالي رموز الإدخال…
178رموز الإخراج…
2,563رموز الاستدلال…
Gemini 3 PRO Previewنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
10.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)3.88sزمن الاستجابة (الحد الأقصى)4.23sزمن الاستجابة (الإجمالي)7.77sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)15.92sزمن الاستجابة (الحد الأقصى)15.92sزمن الاستجابة (الإجمالي)15.92sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
15.92sزمن الاستجابة (المتوسط)…
8,909إجمالي رموز الإدخال…
295رموز الإخراج…
701رموز الاستدلال…
Gemini 3 PRO Previewنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
10.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
100.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.لا توجد إجابات فاشلة.زمن الاستجابة (المتوسط)11.96sزمن الاستجابة (الحد الأقصى)11.96sزمن الاستجابة (الإجمالي)11.96sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
0.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.إجابة خاطئة: 1زمن الاستجابة (المتوسط)34.01sزمن الاستجابة (الحد الأقصى)34.01sزمن الاستجابة (الإجمالي)34.01sيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…
34.01sزمن الاستجابة (المتوسط)…
183إجمالي رموز الإدخال…
16رموز الإخراج…
5,961رموز الاستدلال…
Gemini 3 PRO Previewنموذج مؤرشف: لن يتم تحديث هذا النموذج أو اختباره على اختبارات جديدة بعد الآن.
3.0متوسط الدرجة عبر جميع اختبارات القياس.…
10.0تعكس درجة الاتساق ثبات النتائج بين التشغيلات (10 = ثابت جدا حتى لو كان خطأ بشكل ثابت).…
0.0%معدل النجاح لكل محاولة = المحاولات الناجحة / إجمالي المحاولات عبر جميع التشغيلات.…
0الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).…
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.خطأ API: 1زمن الاستجابة (المتوسط)0msزمن الاستجابة (الحد الأقصى)0msزمن الاستجابة (الإجمالي)0msيعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.…