AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY カテゴリ

複合 ランキング

複合 でどのAIモデルが最も強いか、どのモデルが安定しているか、差が大きいのはどこかを確認できます。 並び替え: 応答時間(平均) ↓.

表示モデル数

15

平均 複合 スコア

6.2

順位 モデル 企業 複合 スコア スコア 正解テスト 応答時間(平均)
#20 Qwen3.6 Plus medium Qwen 10.0 8.1 1/1 35.0s
#75 GLM 5.1 none Z.ai 2.8 5.6 0/1 32.6s
#68 gpt-oss-120b medium OpenAI 10.0 5.8 1/1 31.2s
#60 Gemma 4 26B A4B none Google 3.0 6.2 0/1 30.5s
#50 Hunter Alpha medium OpenRouter 4.7 6.7 0/1 30.5s
#30 Step 3.5 Flash medium Stepfun 10.0 7.9 1/1 29.6s
#13 GLM 5 medium Z.ai 10.0 8.4 1/1 29.0s
#15 Gemini 2.5 Flash medium Google 10.0 8.2 1/1 28.4s
#73 Mistral Small 4 medium Mistral 3.0 5.7 0/1 25.3s
#38 GPT-5.4 Nano medium OpenAI 9.8 7.6 1/1 24.1s
#42 Claude Sonnet 4.6 none Anthropic 9.5 7.4 1/1 23.8s
#3 Claude Opus 4.7 medium Anthropic 10.0 9.2 1/1 21.4s
#25 Grok 4.20 Beta medium X AI 10.0 8.0 1/1 20.9s
#16 GPT-5.4 medium OpenAI 10.0 8.2 1/1 20.6s
#88 Nemotron 3 Super none NVIDIA 3.0 5.1 0/1 20.0s

複合 スコア 上位モデル

複合 スコア vs 合計コスト

応答時間(平均) 上位モデル