AI BENCHY
Advertise here

AI BENCHY カテゴリ

反AIトリック ランキング

反AIトリック でどのAIモデルが最も強いか、どのモデルが安定しているか、差が大きいのはどこかを確認できます。 並び替え: 応答時間(平均) ↑.

表示モデル数

15

平均 反AIトリック スコア

6.9

最良モデル

Mistral Small 4 3.4
順位 モデル 企業 反AIトリック スコア スコア 正解テスト 応答時間(平均)
#84 Grok 4.20 Multi Agent Beta medium X AI 6.9 6.6 2/4 3.46s
#16 Gemini 3 Flash Preview low Google 10.0 8.4 4/4 3.48s
#116 Hunter Alpha none OpenRouter 3.5 5.7 0/4 3.81s
#86 Grok 4.1 Fast medium X AI 8.7 6.5 3/4 3.81s
#63 GPT-5.3 Chat none OpenAI 6.7 7.2 2/4 3.86s
#1 Gemini 3 Flash Preview medium Google 10.0 9.8 4/4 3.88s
#10 Claude Opus 4.8 medium Anthropic 10.0 8.7 4/4 3.95s
#65 Grok 4.20 medium X AI 8.2 7.1 3/4 3.95s
#111 Owl Alpha medium Openrouter 4.8 5.7 1/4 3.97s
#57 Step 3.7 Flash low Stepfun 8.7 7.3 3/4 4.02s
#45 GPT-5.4 Mini medium OpenAI 8.6 7.5 3/4 4.05s
#21 GPT-5.4 medium OpenAI 8.3 8.0 3/4 4.11s
#56 MiMo-V2.5 medium Xiaomi 10.0 7.3 4/4 4.14s
#15 GPT-5.3-Codex medium OpenAI 8.7 8.4 3/4 4.16s
#6 GPT-5.5 low OpenAI 10.0 9.0 4/4 4.41s

反AIトリック スコア 上位モデル

反AIトリック スコア vs 合計コスト

応答時間(平均) 上位モデル