#13
Stepfun · الإصدار: 2026-02-01 · stepfun/step-3.5-flash::medium
اختبارات غير مستقرة
2
الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).
29.10s
زمن الاستجابة (الحد الأقصى): 170.45s
زمن الاستجابة (الإجمالي): 290.96s
لم يتبع التعليمات: 3 إجابة خاطئة: 3
الرسوم البيانية
اختر النموذج الأول، ثم انقر على نموذج ثانٍ لفتح صفحة مقارنة جنبًا إلى جنب.
مقارنة سريعة
Step 3.5 Flashmediumمتاح مجانًاvsGemini 3.1 Flash Lite PreviewmediumStep 3.5 Flashmediumمتاح مجانًاvsGLM 5mediumStep 3.5 Flashmediumمتاح مجانًاvsClaude Sonnet 4.6mediumStep 3.5 Flashmediumمتاح مجانًاvsGPT-5.2 ChatnoneStep 3.5 Flashmediumمتاح مجانًاvsQwen3.5-122B-A10BmediumStep 3.5 Flashmediumمتاح مجانًاvsGemini 2.5 FlashmediumStep 3.5 Flashmediumمتاح مجانًاvsGemini 3 Flash PreviewmediumStep 3.5 Flashmediumمتاح مجانًاvsGemini 3.1 Pro PreviewmediumStep 3.5 Flashmediumمتاح مجانًاvsTrinity Large Previewnoneمتاح مجانًا
تفصيل الفئات
| الفئة | متوسط الدرجة | الاتساق | اختبارات صحيحة |
|---|---|---|---|
| Anti-AI Tricks | 10.0 | 10.0 | |
| Combined | 10.0 | 10.0 | |
| Data parsing and extraction | 10.0 | 10.0 | |
| Domain specific | 4.0 | 7.2 | |
| General Intelligence | 6.0 | 10.0 | |
| Instructions following | 9.0 | 6.8 | |
| Puzzle Solving | 4.0 | 10.0 | |
| Tool Calling | 10.0 | 10.0 |