ナビゲーション
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemma 4 26B A4B vs MoonshotAI: Kimi K2.7 Code

概要

Gemma 4 26B A4B vs Kimi K2.7 Code の benchmark 比較: Gemma 4 26B A4B が平均スコアでリードし、7.2 vs 7.0 です。 Gemma 4 26B A4B の benchmark コストが低く、$0.045 vs $0.669 です。 Gemma 4 26B A4B の方が高速で、63.41s vs 83.60s です、成功率は 69.8% vs 66.7% です。

おすすめモデル: Gemma 4 26B A4B - ここでは最高スコア(7.2)で、Kimi K2.7 Code より約 15.2 倍低コストです。

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-06-12

指標 Gemma 4 26B A4B Gemma 4 26B A4B medium リリース: 2026-04-03 無料で利用可能 Kimi K2.7 Code Kimi K2.7 Code medium リリース: 2026-06-12
スコア 7.2 7.0
順位 #60 #65
信頼性 10.0 9.2
一貫性 9.2 7.7
正解テスト
試行ごとの合格率 69.8% 66.7%
不安定なテスト 2 6
総実行回数 63 63
結果あたりのコスト 0.361 6.074
合計コスト $0.045 $0.669
入力価格 $0.060 / 1M $0.950 / 1M
出力価格 $0.330 / 1M $4.000 / 1M
合計入力トークン 40,252 25,991
出力トークン 28,000 80,516
推論トークン 100,490 161,391
応答時間(平均) 63.41s 83.60s
応答時間(最大) 369.32s 365.80s
応答時間(合計) 1268.28s 1671.99s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#60 Gemma 4 26B A4B

medium
Invalid SVG
Cost
$0.000
Time
300.0s
Tokens
0 tok

#65 MoonshotAI: Kimi K2.7 Code

medium
Cost
$0.025
Time
138.0s
Tokens
6,093 tok

スコア上位モデル

スコア vs 総コスト

応答時間(平均)

スコア vs 応答時間(平均)

合計出力トークン

スコア vs 合計出力トークン

カテゴリ内訳

反AIトリック スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemma 4 26B A4B 10.0 10.0 100.0% 0 6.20s 816 1,142 3,045
Kimi K2.7 Code 7.3 5.8 83.3% 2 11.56s 618 3,048 5,041
コーディング スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemma 4 26B A4B 2.9 10.0 0.0% 0 272.54s 5,062 14,838 44,567
Kimi K2.7 Code 7.6 7.2 77.8% 1 146.73s 4,650 1,864 25,635
複合 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemma 4 26B A4B 9.6 10.0 100.0% 0 73.55s 17,092 5,415 13,112
Kimi K2.7 Code 4.7 1.6 66.7% 1 34.83s 11,271 444 3,906
データ解析と抽出 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemma 4 26B A4B 10.0 10.0 100.0% 0 16.51s 8,334 1,567 2,827
Kimi K2.7 Code 10.0 10.0 100.0% 0 12.27s 7,014 248 2,569
ドメイン特化 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemma 4 26B A4B 2.9 4.4 22.2% 2 23.62s 516 2,469 7,105
Kimi K2.7 Code 5.3 7.2 44.4% 1 213.29s 431 55,572 63,639
汎用知能 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemma 4 26B A4B 10.0 10.0 100.0% 0 29.76s 567 25 5,075
Kimi K2.7 Code 10.0 10.0 100.0% 0 10.78s 477 1,024 1,071
指示追従 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemma 4 26B A4B 10.0 10.0 100.0% 0 17.54s 777 887 4,470
Kimi K2.7 Code 9.9 10.0 100.0% 0 5.39s 669 725 1,232
パズル解決 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemma 4 26B A4B 10.0 10.0 100.0% 0 5.79s 801 410 2,128
Kimi K2.7 Code 5.9 7.7 44.4% 1 41.00s 651 15,438 17,368
ツール呼び出し スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemma 4 26B A4B 10.0 10.0 100.0% 0 9.01s 6,096 450 1,256
Kimi K2.7 Code 3.0 10.0 0.0% 0 0ms 0 0 0
雑学 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemma 4 26B A4B 3.0 10.0 0.0% 0 180.87s 191 797 16,905
Kimi K2.7 Code 3.0 10.0 0.0% 0 341.76s 210 2,153 40,930

クイック比較

比較ペアを切り替え