AI BENCHY
Advertise here

AI BENCHY カテゴリ

反AIトリック ランキング

反AIトリック でどのAIモデルが最も強いか、どのモデルが安定しているか、差が大きいのはどこかを確認できます。 並び替え: 指標 ↑.

表示モデル数

15

平均 反AIトリック スコア

6.9

最良モデル

Seed-2.0-Lite 3.0
順位 モデル 企業 反AIトリック スコア スコア 正解テスト 応答時間(平均)
#149 Nemotron 3 Nano Omni 30b A3b Reasoning medium NVIDIA 6.4 4.6 2/4 1.20s
#94 GPT-5 Nano medium OpenAI 6.5 6.3 2/4 25.5s
#32 Gemini 3.5 Flash minimal Google 6.5 7.7 2/4 892ms
#34 Qwen3.7 Max none Qwen 6.5 7.7 2/4 1.08s
#52 Claude Sonnet 4.6 medium Anthropic 6.5 7.4 2/4 2.98s
#68 Claude Opus 4.8 none Anthropic 6.5 7.0 2/4 3.40s
#85 Gemma 4 31B none Google 6.5 6.5 2/4 1.85s
#88 Qwen3.7 Plus none Qwen 6.5 6.4 2/4 1.38s
#92 Laguna M.1 medium Poolside 6.5 6.4 2/4 4.87s
#126 gpt-oss-120b none OpenAI 6.5 5.4 2/4 32.8s
#42 GPT-5.2 medium OpenAI 6.5 7.5 2/4 7.81s
#73 Seed-2.0-Mini medium Bytedance Seed 6.6 6.9 2/4 74.7s
#136 Elephant Alpha medium Openrouter 6.6 5.1 2/4 1.19s
#137 Elephant Alpha none Openrouter 6.6 5.1 2/4 963ms
#99 gpt-oss-120b medium OpenAI 6.7 6.1 2/4 10.2s

反AIトリック スコア 上位モデル

反AIトリック スコア vs 合計コスト

応答時間(平均) 上位モデル