AI BENCHY
Advertise here

#108

Step 3.5 Flash

Stepfun リリース: 2026-02-01 テスト日時: 2026-04-11 01:44 stepfun/step-3.5-flash::none
(medium) (none)

アーカイブ済みモデル: このモデルは今後更新されず、新しいテストでも評価されません。

スコア

3.0

一貫性

10.0

信頼性

該当なし

合計出力トークン

0

????

$0.100 / 1M

????

$0.300 / 1M

正解テスト

誤答テスト数: 1

試行ごとの合格率: 0.0%

不安定なテスト

0

不安定なテストは、実行間で結果が混在しています(少なくとも1回合格かつ1回失敗)。

応答時間(平均)

0ms

応答時間(最大): 0ms

応答時間(合計): 0ms

実行履歴

テスト日時 スコア 信頼性 正解テスト 合計コスト 比較する
2026-05-08 15:30 新しいテストを追加 7.8 10.0 $0.020 比較する
2026-04-11 01:44 最初に記録された実行 3.0 該当なし $0.000 現在の実行

チャート

最初のモデルを選択し、次に2つ目のモデルをクリックして並列比較ページを開きます。

合計出力トークン

スコア vs 合計出力トークン

クイック比較

カテゴリ内訳

カテゴリ スコア 一貫性 正解テスト
コーディング 3.0 10.0

比較対象モデル