AI BENCHY Compare
Inception: Mercury 2 vs Elephant
ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-04-16
| 指標 | Mercury 2 Mercury 2 none | Elephant Elephant medium |
|---|---|---|
| スコア | 4.8 | 5.2 |
| 順位 | #89 | #79 |
| 一貫性 | 9.0 | 9.6 |
| 正解テスト | ||
| 試行ごとの合格率 | 27.8% | 29.6% |
| 不安定なテスト | 2 | 1 |
| 総実行回数 | 54 | 54 |
| 結果あたりのコスト | 0.165 | 0.000 |
| 合計コスト | $0.007 | $0.000 |
| ???? | $0.250 / 1M | $0.000 / 1M |
| ???? | $0.750 / 1M | $0.000 / 1M |
| 出力トークン | 1,625 | 2,596 |
| 推論トークン | 0 | 0 |
| 応答時間(平均) | 613ms | 1.27s |
| 応答時間(最大) | 1.27s | 3.70s |
| 応答時間(合計) | 11.04s | 22.82s |
スコア vs 総コスト
応答時間(平均)
スコア vs 応答時間(平均)
合計出力トークン
スコア vs 合計出力トークン
カテゴリ内訳
クイック比較
比較ペアを切り替え
ElephantmediumvsGrok 4.20noneMistral Small 4nonevsElephantmediumgpt-oss-120bnone無料で利用可能vsElephantmediumMercury 2nonevsQwen3 Coder NextmediumTrinity Large Previewnone無料で利用可能vsElephantmediumGPT-5.4 MininonevsElephantmediumElephantmediumvsQwen3 Coder NextnoneNemotron 3 Supernone無料で利用可能vsElephantmediumMercury 2nonevsGLM 4.7 FlashmediumElephantmediumvsGLM 5 TurbononeKimi K2.5nonevsElephantmediumElephantmediumvsGLM 5.1none