AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY カテゴリ

反AIトリック ランキング

反AIトリック でどのAIモデルが最も強いか、どのモデルが安定しているか、差が大きいのはどこかを確認できます。 並び替え: 指標 ↑.

表示モデル数

15

平均 反AIトリック スコア

6.7

最良モデル

Seed-2.0-Lite 3.0
順位 モデル 企業 反AIトリック スコア スコア 正解テスト 応答時間(平均)
#25 Grok 4.20 Beta medium X AI 8.7 8.0 3/4 3.16s
#28 GPT-5.2 Chat none OpenAI 8.7 7.9 3/4 3.40s
#52 Grok 4.1 Fast medium X AI 8.7 6.7 3/4 3.81s
#17 Gemini 3.1 Flash Lite Preview medium Google 9.1 8.2 3/4 2.33s
#1 Gemini 3 Flash Preview medium Google 10.0 10.0 4/4 4.13s
#2 Gemini 3.1 Pro Preview medium Google 10.0 9.6 4/4 7.90s
#5 Gemini 3 Flash Preview low Google 10.0 8.8 4/4 3.48s
#9 Qwen3.6 Plus Preview medium Qwen 10.0 8.5 4/4 9.90s
#11 Gemini 3.1 Flash Lite Preview high Google 10.0 8.4 3/3 43.9s
#12 Gemini 3 PRO Preview medium Google 10.0 8.4 4/4 15.0s
#13 GLM 5 medium Z.ai 10.0 8.4 4/4 23.7s
#14 Gemma 4 31B medium Google 10.0 8.3 4/4 12.9s
#18 GLM 5 Turbo medium Z.ai 10.0 8.1 4/4 4.82s
#19 Qwen3.5-122B-A10B medium Qwen 10.0 8.1 4/4 9.75s
#20 Qwen3.6 Plus medium Qwen 10.0 8.1 4/4 9.90s

反AIトリック スコア 上位モデル

反AIトリック スコア vs 合計コスト

応答時間(平均) 上位モデル