AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY カテゴリ

反AIトリック ランキング

反AIトリック でどのAIモデルが最も強いか、どのモデルが安定しているか、差が大きいのはどこかを確認できます。 並び替え: 応答時間(平均) ↓.

表示モデル数

15

平均 反AIトリック スコア

6.9

最良モデル

Seed-2.0-Mini 6.6
順位 モデル 企業 反AIトリック スコア スコア 正解テスト 応答時間(平均)
#73 Seed-2.0-Mini medium Bytedance Seed 6.6 6.9 2/4 74.7s
#49 Qwen3.5-Flash medium Qwen 10.0 7.4 4/4 59.1s
#76 Kimi K2.5 medium Moonshot AI 7.3 6.8 2/4 51.4s
#25 Qwen3.5 Plus 2026-02-15 medium Qwen 8.2 7.9 3/4 45.8s
#12 Gemini 3.1 Flash Lite Preview high Google 10.0 8.6 3/3 43.9s
#96 Ring-2.6-1T none Inclusionai 9.2 6.2 3/4 43.3s
#75 Ring-2.6-1T medium Inclusionai 10.0 6.9 4/4 42.2s
#62 Step 3.5 Flash medium Stepfun 10.0 7.2 4/4 40.6s
#130 MiniMax M2.7 medium Minimax 7.9 5.3 2/4 40.3s
#53 Gemini 3.1 Flash Lite high Google 8.7 7.3 3/4 37.2s
#83 Step 3.5 Flash none Stepfun 10.0 6.6 4/4 35.0s
#161 Qwen3.5-9B medium Qwen 5.1 4.2 1/4 34.4s
#126 gpt-oss-120b none OpenAI 6.5 5.4 2/4 32.8s
#31 DeepSeek V4 Flash high DeepSeek 8.3 7.7 3/4 28.5s
#94 GPT-5 Nano medium OpenAI 6.5 6.3 2/4 25.5s

反AIトリック スコア 上位モデル

反AIトリック スコア vs 合計コスト

応答時間(平均) 上位モデル