قارن الرسوم البيانية المنهجية

اللغة:

❤️ Made by XCS

#13

Step 3.5 Flash

Stepfun · الإصدار: 2026-02-01 · stepfun/step-3.5-flash::medium

متوسط الدرجة

7.4

التكلفة لكل نتيجة

0.000

الاتساق

9.1

إجمالي التكلفة

$0.000

اختبارات صحيحة

الاختبارات الخاطئة: 6

معدل النجاح لكل محاولة: 68.8%

اختبارات غير مستقرة

2

الاختبارات غير المستقرة لها نتائج مختلطة بين التشغيلات (نجاح واحد على الأقل وفشل واحد على الأقل).

زمن الاستجابة (المتوسط)

29.10s

زمن الاستجابة (الحد الأقصى): 170.45s

زمن الاستجابة (الإجمالي): 290.96s

لم يتبع التعليمات: 3 إجابة خاطئة: 3

الرسوم البيانية

اختر النموذج الأول، ثم انقر على نموذج ثانٍ لفتح صفحة مقارنة جنبًا إلى جنب.

أفضل النماذج حسب الدرجة

متوسط الدرجة vs إجمالي التكلفة

زمن الاستجابة (المتوسط)

متوسط الدرجة vs زمن الاستجابة (المتوسط)

مقارنة سريعة

Step 3.5 Flashmediumمتاح مجانًاvsGemini 3.1 Flash Lite Previewmedium Step 3.5 Flashmediumمتاح مجانًاvsGLM 5medium Step 3.5 Flashmediumمتاح مجانًاvsClaude Sonnet 4.6medium Step 3.5 Flashmediumمتاح مجانًاvsGPT-5.2 Chatnone Step 3.5 Flashmediumمتاح مجانًاvsQwen3.5-122B-A10Bmedium Step 3.5 Flashmediumمتاح مجانًاvsGemini 2.5 Flashmedium Step 3.5 Flashmediumمتاح مجانًاvsGemini 3 Flash Previewmedium Step 3.5 Flashmediumمتاح مجانًاvsGemini 3.1 Pro Previewmedium Step 3.5 Flashmediumمتاح مجانًاvsTrinity Large Previewnoneمتاح مجانًا

تفصيل الفئات

الفئة	متوسط الدرجة	الاتساق	اختبارات صحيحة
Anti-AI Tricks	10.0	10.0
Combined	10.0	10.0
Data parsing and extraction	10.0	10.0
Domain specific	4.0	7.2
General Intelligence	6.0	10.0
Instructions following	9.0	6.8
Puzzle Solving	4.0	10.0
Tool Calling	10.0	10.0