ナビゲーション
AI BENCHY
Advertise here

AI BENCHY Compare

MoonshotAI: Kimi K2.5 vs Qwen: Qwen3.5-35B-A3B

概要

Kimi K2.5 vs Qwen3.5-35B-A3B の benchmark 比較: Qwen3.5-35B-A3B が平均スコアでリードし、6.3 vs 5.5 です。 Kimi K2.5 の benchmark コストが低く、$0.027 vs $0.401 です。 Kimi K2.5 の方が高速で、13.18s vs 72.57s です、成功率は 34.9% vs 69.8% です。

おすすめモデル: Kimi K2.5 - スコアはここでの最高値に近く(5.5 vs 6.3)、Qwen3.5-35B-A3B より約 14.8 倍低コストです。

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-06-18

指標 Kimi K2.5 Kimi K2.5 none リリース: 2026-01-27 Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium リリース: 2026-02-24
スコア 5.5 6.3
順位 #118 #89
信頼性 10.0 10.0
一貫性 8.9 7.5
正解テスト
試行ごとの合格率 34.9% 69.8%
不安定なテスト 3 6
総実行回数 63 63
結果あたりのコスト 0.442 5.162
合計コスト $0.027 $0.401
入力価格 $0.375 / 1M $0.140 / 1M
出力価格 $2.025 / 1M $1.000 / 1M
合計入力トークン 36,034 42,196
出力トークン 6,657 40,630
推論トークン 0 353,577
応答時間(平均) 13.18s 72.57s
応答時間(最大) 42.13s 409.98s
応答時間(合計) 184.47s 1524.04s

生成ショーケース

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#118 MoonshotAI: Kimi K2.5

none
コスト
$0.015
時間
89.1s
トークン
5,421 tok

#89 Qwen3.5-35B-A3B

medium
コスト
$0.009
時間
71.4s
トークン
8,631 tok

スコア上位モデル

スコア vs 総コスト

応答時間(平均)

スコア vs 応答時間(平均)

合計出力トークン

スコア vs 合計出力トークン

カテゴリ内訳

反AIトリック スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Kimi K2.5 3.6 8.4 8.3% 1 6.24s 652 373 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 21.13s 672 798 42,652
コーディング スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Kimi K2.5 5.5 10.0 33.3% 0 24.56s 7,311 4,708 0
Qwen3.5-35B-A3B 5.9 9.3 33.3% 0 206.65s 4,106 23,844 111,462
複合 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Kimi K2.5 2.8 2.1 33.3% 1 19.16s 12,264 748 0
Qwen3.5-35B-A3B 4.7 1.6 66.7% 1 75.34s 20,992 775 12,485
データ解析と抽出 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Kimi K2.5 7.3 5.8 83.3% 1 42.13s 7,180 187 0
Qwen3.5-35B-A3B 7.3 5.9 83.3% 1 59.33s 6,061 235 19,493
ドメイン特化 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Kimi K2.5 5.3 10.0 33.3% 0 4.38s 753 29 0
Qwen3.5-35B-A3B 4.1 4.4 44.5% 2 88.34s 500 41 46,368
汎用知能 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Kimi K2.5 10.0 10.0 100.0% 0 4.00s 483 76 0
Qwen3.5-35B-A3B 2.8 1.6 33.3% 1 30.30s 172 20 3,753
指示追従 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Kimi K2.5 6.5 10.0 50.0% 0 2.67s 677 60 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 24.45s 699 97 17,361
パズル解決 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Kimi K2.5 3.0 10.0 0.0% 0 4.04s 667 236 0
Qwen3.5-35B-A3B 8.2 7.2 88.9% 1 33.13s 597 3,592 26,585
ツール呼び出し スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Kimi K2.5 10.0 10.0 100.0% 0 13.99s 5,835 220 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 4.65s 8,193 309 1,365
雑学 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Kimi K2.5 3.0 10.0 0.0% 0 3.90s 212 20 0
Qwen3.5-35B-A3B 3.0 10.0 0.0% 0 177.35s 204 10,919 72,053

クイック比較

比較ペアを切り替え