AI BENCHY
Your ad here

AI BENCHY カテゴリ

パズル解決 ランキング

パズル解決 でどのAIモデルが最も強いか、どのモデルが安定しているか、差が大きいのはどこかを確認できます。 並び替え: 応答時間(平均) ↑.

表示モデル数

8

平均 パズル解決 スコア

6.4

最良モデル

Grok 4.20 5.3
順位 モデル 企業 パズル解決 スコア スコア 正解テスト 応答時間(平均)
#43 Qwen3.5-35B-A3B medium Qwen 6.4 7.4 1/3 31.6s
#97 Qwen3.5-9B medium Qwen 3.1 4.4 0/3 33.4s
#8 Qwen3.5 Plus 2026-02-15 medium Qwen 10.0 8.5 3/3 34.6s
#27 DeepSeek V3.2 medium DeepSeek 8.2 8.0 2/3 36.9s
#46 Kimi K2.5 medium Moonshot AI 5.3 7.0 1/3 45.4s
#11 Gemini 3.1 Flash Lite Preview high Google 7.7 8.4 2/3 46.3s
#32 Qwen3.5-Flash medium Qwen 6.4 7.8 1/3 56.7s
#10 Qwen3.5-27B medium Qwen 8.2 8.4 2/3 64.6s

パズル解決 スコア 上位モデル

パズル解決 スコア vs 合計コスト

応答時間(平均) 上位モデル