#13
Stepfun · リリース: 2026-02-01 · stepfun/step-3.5-flash::medium
不安定なテスト
2
不安定なテストは、実行間で結果が混在しています(少なくとも1回合格かつ1回失敗)。
指示に従っていない: 3 不正解: 3
チャート
最初のモデルを選択し、次に2つ目のモデルをクリックして並列比較ページを開きます。
クイック比較
Step 3.5 Flashmedium無料で利用可能vsGemini 3.1 Flash Lite PreviewmediumStep 3.5 Flashmedium無料で利用可能vsGLM 5mediumStep 3.5 Flashmedium無料で利用可能vsClaude Sonnet 4.6mediumStep 3.5 Flashmedium無料で利用可能vsGPT-5.2 ChatnoneStep 3.5 Flashmedium無料で利用可能vsQwen3.5-122B-A10BmediumStep 3.5 Flashmedium無料で利用可能vsGemini 2.5 FlashmediumStep 3.5 Flashmedium無料で利用可能vsGemini 3 Flash PreviewmediumStep 3.5 Flashmedium無料で利用可能vsGemini 3.1 Pro PreviewmediumStep 3.5 Flashmedium無料で利用可能vsTrinity Large Previewnone無料で利用可能
カテゴリ内訳
| カテゴリ | 平均スコア | 一貫性 | 正解テスト |
|---|---|---|---|
| Anti-AI Tricks | 10.0 | 10.0 | |
| Combined | 10.0 | 10.0 | |
| Data parsing and extraction | 10.0 | 10.0 | |
| Domain specific | 4.0 | 7.2 | |
| General Intelligence | 6.0 | 10.0 | |
| Instructions following | 9.0 | 6.8 | |
| Puzzle Solving | 4.0 | 10.0 | |
| Tool Calling | 10.0 | 10.0 |