#16
Gemini 2.5 Flash
Google · الإصدار: 2025-06-17 · google/gemini-2.5-flash::medium
متوسط الدرجة
7.06
التكلفة لكل نتيجة
2.762
الاتساق
9.39
إجمالي التكلفة
$0.249
اختبارات صحيحة
9
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.
الاختبارات الخاطئة
5
معدل النجاح لكل محاولة: 69.1%
اختبارات غير مستقرة
1
زمن الاستجابة: المتوسط 11.74s · الإجمالي 164.33s · الحد الأقصى 95.48s
إجابة خاطئة: 4
لم يتبع التعليمات: 1
أفضل النماذج حسب الدرجة
اختر النموذج الأول، ثم انقر على نموذج ثانٍ لفتح صفحة مقارنة جنبًا إلى جنب.
مقارنة سريعة
Gemini 2.5 FlashmediumvsGemini 3 Flash PreviewnoneGemini 2.5 FlashmediumvsStep 3.5 Flashmediumمتاح مجانًاGemini 2.5 FlashmediumvsGPT-5.3 ChatnoneGemini 2.5 FlashmediumvsDeepSeek V3.2mediumGemini 2.5 FlashmediumvsGLM 5mediumGemini 2.5 FlashmediumvsGPT-5.2mediumGemini 2.5 FlashmediumvsGemini 3 Flash PreviewmediumGemini 2.5 FlashmediumvsGemini 3.1 Pro Previewmedium
تفصيل الفئات
| الفئة | متوسط الدرجة | الاتساق | اختبارات صحيحة |
|---|---|---|---|
| Anti-AI Tricks | 7.34 | 10.00 | 2/3 |
| Data parsing and extraction | 9.88 | 10.00 | 2/2 |
| Domain specific | 4.00 | 7.21 | 1/3 |
| Instructions following | 7.00 | 9.91 | 1/2 |
| Puzzle Solving | 7.00 | 10.00 | 2/3 |
| Tool Calling | 10.00 | 10.00 | 1/1 |