AI BENCHY
Advertise here

AI BENCHY カテゴリ

反AIトリック ランキング

反AIトリック でどのAIモデルが最も強いか、どのモデルが安定しているか、差が大きいのはどこかを確認できます。 並び替え: 正解テスト ↑.

表示モデル数

15

平均 反AIトリック スコア

6.9

最良モデル

Gemini 2.5 Flash 3.0
順位 モデル 企業 反AIトリック スコア スコア 正解テスト 応答時間(平均)
#85 Gemma 4 31B none Google 6.5 6.5 2/4 1.85s
#88 Qwen3.7 Plus none Qwen 6.5 6.4 2/4 1.38s
#90 Gemini 3.1 Flash Lite none Google 7.5 6.4 2/4 1.07s
#91 GPT-5.5 none OpenAI 6.9 6.4 2/4 1.31s
#92 Laguna M.1 medium Poolside 6.5 6.4 2/4 4.87s
#94 GPT-5 Nano medium OpenAI 6.5 6.3 2/4 25.5s
#99 gpt-oss-120b medium OpenAI 6.7 6.1 2/4 10.2s
#103 DeepSeek V4 Pro high DeepSeek 6.4 6.0 2/4 16.5s
#107 Laguna Xs.2 medium Poolside 6.9 5.8 2/4 2.68s
#126 gpt-oss-120b none OpenAI 6.5 5.4 2/4 32.8s
#129 MiniMax M2.5 medium Minimax 7.9 5.3 2/4 20.8s
#130 MiniMax M2.7 medium Minimax 7.9 5.3 2/4 40.3s
#136 Elephant Alpha medium Openrouter 6.6 5.1 2/4 1.19s
#137 Elephant Alpha none Openrouter 6.6 5.1 2/4 963ms
#138 Ling-2.6-flash none Inclusionai 6.8 5.0 2/4 11.8s

反AIトリック スコア 上位モデル

反AIトリック スコア vs 合計コスト

応答時間(平均) 上位モデル