#36
Gemini 2.5 Flash
Google · الإصدار: 2025-06-17 · google/gemini-2.5-flash::none
متوسط الدرجة
5.34
التكلفة لكل نتيجة
0.107
الاتساق
9.40
إجمالي التكلفة
$0.007
اختبارات صحيحة
6
يعد الاختبار ناجحا بالكامل فقط إذا نجحت كل تشغيلاته.
الاختبارات الخاطئة
8
معدل النجاح لكل محاولة: 47.6%
اختبارات غير مستقرة
1
زمن الاستجابة: المتوسط 698ms · الإجمالي 9.78s · الحد الأقصى 1.91s
إجابة خاطئة: 6
لم يتبع التعليمات: 2
أفضل النماذج حسب الدرجة
اختر النموذج الأول، ثم انقر على نموذج ثانٍ لفتح صفحة مقارنة جنبًا إلى جنب.
مقارنة سريعة
Gemini 2.5 FlashnonevsMiniMax M2.5mediumGemini 2.5 FlashnonevsQwen3.5-122B-A10BnoneGemini 2.5 Flashnonevsgpt-oss-120bmediumمتاح مجانًاGemini 2.5 FlashnonevsGPT-4o-mininoneGemini 2.5 FlashnonevsGPT-5 MinimediumGemini 2.5 FlashnonevsDeepSeek V3.2noneGemini 2.5 FlashnonevsGemini 3 Flash PreviewmediumGemini 2.5 FlashnonevsGemini 3.1 Pro PreviewmediumGemini 2.5 FlashnonevsStep 3.5 Flashmediumمتاح مجانًا
تفصيل الفئات
| الفئة | متوسط الدرجة | الاتساق | اختبارات صحيحة |
|---|---|---|---|
| Anti-AI Tricks | 1.00 | 10.00 | 0/3 |
| Data parsing and extraction | 9.88 | 10.00 | 2/2 |
| Domain specific | 4.00 | 7.21 | 1/3 |
| Instructions following | 8.00 | 9.99 | 1/2 |
| Puzzle Solving | 4.67 | 10.00 | 1/3 |
| Tool Calling | 10.00 | 10.00 | 1/1 |