ナビゲーション
AI BENCHY
Advertise here

AI BENCHY Compare

MiniMax: MiniMax M2.7 vs MoonshotAI: Kimi K2.5

概要

MiniMax M2.7 vs Kimi K2.5 の benchmark 比較: Kimi K2.5 が平均スコアでリードし、5.5 vs 5.2 です。 Kimi K2.5 の benchmark コストが低く、$0.027 vs $0.104 です。 Kimi K2.5 の方が高速で、13.18s vs 38.18s です、成功率は 46.0% vs 34.9% です。

おすすめモデル: Kimi K2.5 - ここでは最高スコア(5.5)で、MiniMax M2.7 より約 3.9 倍低コストです。

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-06-18

指標 MiniMax M2.7 MiniMax M2.7 medium リリース: 2026-03-18 Kimi K2.5 Kimi K2.5 none リリース: 2026-01-27
スコア 5.2 5.5
順位 #127 #118
信頼性 10.0 10.0
一貫性 6.8 8.9
正解テスト
試行ごとの合格率 46.0% 34.9%
不安定なテスト 8 3
総実行回数 63 63
結果あたりのコスト 2.494 0.442
合計コスト $0.104 $0.027
入力価格 $0.250 / 1M $0.375 / 1M
出力価格 $1.000 / 1M $2.025 / 1M
合計入力トークン 34,371 36,034
出力トークン 8,981 6,657
推論トークン 89,812 0
応答時間(平均) 38.18s 13.18s
応答時間(最大) 196.21s 42.13s
応答時間(合計) 763.60s 184.47s

生成ショーケース

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#127 MiniMax M2.7

medium
コスト
$0.022
時間
22.8s
トークン
9,250 tok

#118 MoonshotAI: Kimi K2.5

none
コスト
$0.015
時間
89.1s
トークン
5,421 tok

スコア上位モデル

スコア vs 総コスト

応答時間(平均)

スコア vs 応答時間(平均)

合計出力トークン

スコア vs 合計出力トークン

カテゴリ内訳

反AIトリック スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
MiniMax M2.7 7.9 6.3 83.3% 2 40.32s 654 3,010 17,716
Kimi K2.5 3.6 8.4 8.3% 1 6.24s 652 373 0
コーディング スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
MiniMax M2.7 5.7 9.1 33.3% 0 101.89s 2,961 1,231 38,841
Kimi K2.5 5.5 10.0 33.3% 0 24.56s 7,311 4,708 0
複合 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
MiniMax M2.7 4.7 1.6 66.7% 1 41.03s 14,233 369 4,480
Kimi K2.5 2.8 2.1 33.3% 1 19.16s 12,264 748 0
データ解析と抽出 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
MiniMax M2.7 6.3 5.8 66.7% 1 21.95s 7,152 187 5,882
Kimi K2.5 7.3 5.8 83.3% 1 42.13s 7,180 187 0
ドメイン特化 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
MiniMax M2.7 3.0 10.0 0.0% 0 19.00s 245 8 2,796
Kimi K2.5 5.3 10.0 33.3% 0 4.38s 753 29 0
汎用知能 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
MiniMax M2.7 3.9 2.5 33.3% 1 38.70s 486 92 5,204
Kimi K2.5 10.0 10.0 100.0% 0 4.00s 483 76 0
指示追従 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
MiniMax M2.7 3.8 5.8 33.3% 1 12.80s 687 350 2,600
Kimi K2.5 6.5 10.0 50.0% 0 2.67s 677 60 0
パズル解決 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
MiniMax M2.7 5.9 7.2 55.6% 1 24.87s 675 362 7,840
Kimi K2.5 3.0 10.0 0.0% 0 4.04s 667 236 0
ツール呼び出し スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
MiniMax M2.7 4.7 1.6 66.7% 1 12.05s 7,067 304 1,001
Kimi K2.5 10.0 10.0 100.0% 0 13.99s 5,835 220 0
雑学 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
MiniMax M2.7 3.0 10.0 0.0% 0 22.77s 211 3,068 3,452
Kimi K2.5 3.0 10.0 0.0% 0 3.90s 212 20 0

クイック比較

比較ペアを切り替え