AI BENCHY
Your ad here

AI BENCHY カテゴリ

複合 ランキング

複合 でどのAIモデルが最も強いか、どのモデルが安定しているか、差が大きいのはどこかを確認できます。 並び替え: 指標 ↑.

表示モデル数

15

平均 複合 スコア

6.2

最良モデル

Qwen3.5-27B 2.8
順位 モデル 企業 複合 スコア スコア 正解テスト 応答時間(平均)
#59 Qwen3.5-Flash none Qwen 3.0 6.2 0/1 6.22s
#60 Gemma 4 26B A4B none Google 3.0 6.2 0/1 30.5s
#61 Seed-2.0-Lite none Bytedance Seed 3.0 6.2 0/1 6.59s
#62 Gemini 2.5 Flash none Google 3.0 6.2 0/1 4.39s
#63 Qwen3.5-35B-A3B none Qwen 3.0 6.1 0/1 47.4s
#65 MiMo-V2-Pro none Xiaomi 3.0 6.0 0/1 6.58s
#66 GPT-5.4 none OpenAI 3.0 5.9 0/1 2.89s
#69 Kimi K2.6 none Moonshot AI 3.0 5.8 0/1 3.38s
#70 Qwen3.5-122B-A10B none Qwen 3.0 5.7 0/1 46.0s
#72 Hunter Alpha none OpenRouter 3.0 5.7 0/1 15.2s
#73 Mistral Small 4 medium Mistral 3.0 5.7 0/1 25.3s
#74 GLM 4.7 Flash none Z.ai 3.0 5.6 0/1 3.22s
#77 GLM 5 Turbo none Z.ai 3.0 5.5 0/1 4.89s
#78 Trinity Large Preview none Arcee AI 3.0 5.3 0/1 8.91s
#79 Grok 4.20 Beta none X AI 3.0 5.3 0/1 6.48s

複合 スコア 上位モデル

複合 スコア vs 合計コスト

応答時間(平均) 上位モデル