AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY カテゴリ

反AIトリック ランキング

反AIトリック でどのAIモデルが最も強いか、どのモデルが安定しているか、差が大きいのはどこかを確認できます。 並び替え: 応答時間(平均) ↑.

表示モデル数

15

平均 反AIトリック スコア

6.7

最良モデル

Mistral Small 4 3.4
順位 モデル 企業 反AIトリック スコア スコア 正解テスト 応答時間(平均)
#94 MiMo-V2-Flash none Xiaomi 3.2 4.5 0/4 1.19s
#66 GPT-5.4 none OpenAI 3.2 5.9 0/4 1.21s
#21 Gemini 3 Flash Preview none Google 8.3 8.1 3/4 1.25s
#60 Gemma 4 26B A4B none Google 8.3 6.2 3/4 1.28s
#59 Qwen3.5-Flash none Qwen 3.5 6.2 0/4 1.32s
#89 GPT-4o-mini none OpenAI 4.8 4.9 1/4 1.34s
#69 Kimi K2.6 none Moonshot AI 4.6 5.8 1/4 1.39s
#63 Qwen3.5-35B-A3B none Qwen 3.4 6.1 0/4 1.43s
#70 Qwen3.5-122B-A10B none Qwen 4.8 5.7 1/4 1.59s
#90 Qwen3.5-9B none Qwen 3.1 4.8 0/4 1.71s
#65 MiMo-V2-Pro none Xiaomi 3.5 6.0 0/4 1.80s
#3 Claude Opus 4.7 medium Anthropic 8.3 9.2 3/4 1.85s
#48 Gemma 4 31B none Google 6.5 6.9 2/4 1.85s
#49 Qwen3.5 Plus 2026-02-15 none Qwen 4.8 6.8 1/4 1.91s
#35 MiMo-V2-Omni medium Xiaomi 10.0 7.7 4/4 2.11s

反AIトリック スコア 上位モデル

反AIトリック スコア vs 合計コスト

応答時間(平均) 上位モデル