AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY カテゴリ

パズル解決 ランキング

パズル解決 でどのAIモデルが最も強いか、どのモデルが安定しているか、差が大きいのはどこかを確認できます。 並び替え: 応答時間(平均) ↓.

表示モデル数

15

平均 パズル解決 スコア

6.7

最良モデル

Qwen3.6 27B 7.7
順位 モデル 企業 パズル解決 スコア スコア 正解テスト 応答時間(平均)
#21 GPT-5.4 medium OpenAI 8.2 8.0 2/3 9.14s
#5 Qwen3.7 Max medium Qwen 10.0 9.1 3/3 8.84s
#126 gpt-oss-120b none OpenAI 6.0 5.4 1/3 8.21s
#93 Qwen3.6 Plus Preview medium Qwen 5.3 6.3 1/3 7.52s
#89 Hy3 preview low Tencent 5.3 6.4 1/3 7.51s
#86 Grok 4.1 Fast medium X AI 5.3 6.5 1/3 7.40s
#62 Step 3.5 Flash medium Stepfun 5.3 7.2 1/3 7.22s
#133 DeepSeek V3.2 none DeepSeek 7.6 5.2 2/3 6.91s
#4 Gemini 3.1 Pro Preview medium Google 10.0 9.4 3/3 6.90s
#9 GPT-5.5 medium OpenAI 10.0 8.8 3/3 6.76s
#138 Ling-2.6-flash none Inclusionai 2.9 5.0 0/3 6.51s
#26 Qwen3.6 Plus medium Qwen 10.0 7.9 3/3 6.34s
#39 Qwen3.6 Flash medium Qwen 8.2 7.5 2/3 6.29s
#65 Grok 4.20 medium X AI 7.7 7.1 2/3 6.22s
#22 Step 3.7 Flash medium Stepfun 5.7 8.0 1/3 6.19s

パズル解決 スコア 上位モデル

パズル解決 スコア vs 合計コスト

応答時間(平均) 上位モデル