ナビゲーション
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs MoonshotAI: Kimi K2.7 Code

概要

Gemini 3 Flash Preview vs Kimi K2.7 Code の benchmark 比較: Gemini 3 Flash Preview が平均スコアでリードし、7.4 vs 7.0 です。 Gemini 3 Flash Preview の benchmark コストが低く、$0.111 vs $0.669 です。 Gemini 3 Flash Preview の方が高速で、5.76s vs 83.60s です、成功率は 79.4% vs 66.7% です。

おすすめモデル: Gemini 3 Flash Preview - ここでは最高スコア(7.4)で、Kimi K2.7 Code より約 6.1 倍低コストです。

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-06-12

指標 Gemini 3 Flash Preview Gemini 3 Flash Preview low リリース: 2025-12-17 Kimi K2.7 Code Kimi K2.7 Code medium リリース: 2026-06-12
スコア 7.4 7.0
順位 #53 #65
信頼性 10.0 9.2
一貫性 9.2 7.7
正解テスト
試行ごとの合格率 79.4% 66.7%
不安定なテスト 2 6
総実行回数 63 63
結果あたりのコスト 0.689 6.074
合計コスト $0.111 $0.669
入力価格 $0.500 / 1M $0.950 / 1M
出力価格 $3.000 / 1M $4.000 / 1M
合計入力トークン 36,769 25,991
出力トークン 2,076 80,516
推論トークン 28,518 161,391
応答時間(平均) 5.76s 83.60s
応答時間(最大) 14.72s 365.80s
応答時間(合計) 120.93s 1671.99s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#53 Gemini 3 Flash Preview

low
Cost
$0.007
Time
12.1s
Tokens
2,289 tok

#65 MoonshotAI: Kimi K2.7 Code

medium
Cost
$0.025
Time
138.0s
Tokens
6,093 tok

スコア上位モデル

スコア vs 総コスト

応答時間(平均)

スコア vs 応答時間(平均)

合計出力トークン

スコア vs 合計出力トークン

カテゴリ内訳

反AIトリック スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.48s 500 281 3,082
Kimi K2.7 Code 7.3 5.8 83.3% 2 11.56s 618 3,048 5,041
コーディング スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemini 3 Flash Preview 5.8 7.2 44.4% 1 6.00s 8,122 456 7,421
Kimi K2.7 Code 7.6 7.2 77.8% 1 146.73s 4,650 1,864 25,635
複合 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemini 3 Flash Preview 3.0 10.0 0.0% 0 3.27s 12,860 326 0
Kimi K2.7 Code 4.7 1.6 66.7% 1 34.83s 11,271 444 3,906
データ解析と抽出 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 9.40s 7,261 279 3,656
Kimi K2.7 Code 10.0 10.0 100.0% 0 12.27s 7,014 248 2,569
ドメイン特化 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemini 3 Flash Preview 5.3 7.2 44.4% 1 8.05s 645 12 6,410
Kimi K2.7 Code 5.3 7.2 44.4% 1 213.29s 431 55,572 63,639
汎用知能 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.68s 492 120 981
Kimi K2.7 Code 10.0 10.0 100.0% 0 10.78s 477 1,024 1,071
指示追従 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemini 3 Flash Preview 9.9 10.0 100.0% 0 7.02s 621 71 2,752
Kimi K2.7 Code 9.9 10.0 100.0% 0 5.39s 669 725 1,232
パズル解決 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.77s 562 288 3,168
Kimi K2.7 Code 5.9 7.7 44.4% 1 41.00s 651 15,438 17,368
ツール呼び出し スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.99s 5,550 234 415
Kimi K2.7 Code 3.0 10.0 0.0% 0 0ms 0 0 0
雑学 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 2.75s 156 9 633
Kimi K2.7 Code 3.0 10.0 0.0% 0 341.76s 210 2,153 40,930

クイック比較

比較ペアを切り替え