#44
Bytedance Seed
リリース: 2026-02-14
テスト日時: 2026-04-11 01:44
bytedance-seed/seed-2.0-mini::medium
入力価格
$0.100 / 1M
出力価格
$0.400 / 1M
不安定なテスト
2
不安定なテストは、実行間で結果が混在しています(少なくとも1回合格かつ1回失敗)。
実行履歴
| テスト日時 | スコア | 信頼性 | 正解テスト | 合計コスト | 比較する |
|---|---|---|---|---|---|
| 2026-05-22 00:44 スイート変更 | 7.1 | 5.0 | $0.044 | 比較する | |
| 2026-04-11 01:44 最初に記録された実行 | 7.5 | 該当なし | $0.037 | 現在の実行 |
実行比較
| 実行 | スコア | 一貫性 | 信頼性 | 正解テスト | 不安定なテスト | 合計出力トークン | 合計コスト | 応答時間(平均) |
|---|---|---|---|---|---|---|---|---|
| 2026-04-11 01:44 · 最初に記録された実行 | 7.5 | 9.2 | 該当なし | 11/18 | 2 | 81,657 | $0.037 | 69.70s |
| 2026-05-22 00:44 · スイート変更 | 7.1 | 9.2 | 5.0 | 11/20 | 2 | 97,852 | $0.044 | 79.17s |
| 差分 | +0.5 | 0.0 | 0 | 0 | -16195 | -$0.007 | -9472ms |
この 2 つの実行では異なるベンチマークスイートが使われているため、差分にはモデル変化とスイート変化の両方が含まれます。
チャート
最初のモデルを選択し、次に2つ目のモデルをクリックして並列比較ページを開きます。
クイック比較
Seed-2.0-MinimediumvsClaude Opus 4.8noneSeed-2.0-MinimediumvsQwen3.5-35B-A3BmediumSeed-2.0-MinimediumvsGPT-5.4 MinimediumSeed-2.0-MinimediumvsRing-2.6-1TmediumSeed-2.0-MinimediumvsGPT-5.2mediumSeed-2.0-MinimediumvsRing-2.6-1TnoneSeed-2.0-MinimediumvsGemini 3 Flash PreviewmediumSeed-2.0-MinimediumvsGemini 3.5 FlashhighSeed-2.0-MinimediumvsGemini 3.5 Flashlow