AI BENCHY
Your ad here

AI BENCHY カテゴリ

ドメイン特化 ランキング

ドメイン特化 でどのAIモデルが最も強いか、どのモデルが安定しているか、差が大きいのはどこかを確認できます。 並び替え: 正解テスト ↓.

表示モデル数

15

平均 ドメイン特化 スコア

4.8

順位 モデル 企業 ドメイン特化 スコア スコア 正解テスト 応答時間(平均)
#1 Gemini 3 Flash Preview medium Google 10.0 10.0 3/3 21.1s
#2 Gemini 3.1 Pro Preview medium Google 7.7 9.6 2/3 32.7s
#3 Claude Opus 4.7 medium Anthropic 7.7 9.2 2/3 1.17s
#4 Claude Opus 4.7 none Anthropic 7.7 9.2 2/3 1.19s
#14 Gemma 4 31B medium Google 7.7 8.3 2/3 38.5s
#21 Gemini 3 Flash Preview none Google 7.7 8.1 2/3 963ms
#42 Claude Sonnet 4.6 none Anthropic 7.7 7.4 2/3 3.54s
#48 Gemma 4 31B none Google 7.7 6.9 2/3 3.22s
#59 Qwen3.5-Flash none Qwen 7.7 6.2 2/3 905ms
#63 Qwen3.5-35B-A3B none Qwen 7.7 6.1 2/3 485ms
#74 GLM 4.7 Flash none Z.ai 7.7 5.6 2/3 744ms
#5 Gemini 3 Flash Preview low Google 5.3 8.8 1/3 8.05s
#6 Seed-2.0-Lite medium Bytedance Seed 5.9 8.6 1/3 88.7s
#7 GPT-5.3-Codex medium OpenAI 5.9 8.6 1/3 64.3s
#8 Qwen3.5 Plus 2026-02-15 medium Qwen 5.3 8.5 1/3 17.5s

ドメイン特化 スコア 上位モデル

ドメイン特化 スコア vs 合計コスト

応答時間(平均) 上位モデル