AI BENCHY カテゴリ
反AIトリック ランキング
反AIトリック でどのAIモデルが最も強いか、どのモデルが安定しているか、差が大きいのはどこかを確認できます。 並び替え: 正解テスト ↓.
| 順位 | モデル | 企業 | 反AIトリック スコア | スコア | 正解テスト | 応答時間(平均) |
|---|---|---|---|---|---|---|
| #70 | GPT-5.4 Nano medium | OpenAI | 8.3 | 7.0 | 3/4 | 4.52s |
| #72 | DeepSeek V3.2 medium | DeepSeek | 8.2 | 7.0 | 3/4 | 24.2s |
| #78 | Qwen3.6 27B medium | Qwen | 8.3 | 6.8 | 3/4 | 12.6s |
| #86 | Grok 4.1 Fast medium | X AI | 8.7 | 6.5 | 3/4 | 3.81s |
| #87 | Gemini 3.1 Flash Lite minimal | 8.3 | 6.4 | 3/4 | 1.10s | |
| #89 | Hy3 preview low | Tencent | 8.3 | 6.4 | 3/4 | 9.32s |
| #93 | Qwen3.6 Plus Preview medium | Qwen | 8.3 | 6.3 | 3/4 | 11.7s |
| #96 | Ring-2.6-1T none | Inclusionai | 9.2 | 6.2 | 3/4 | 43.3s |
| #100 | Grok Build 0.1 none | X AI | 8.7 | 6.0 | 3/4 | 6.30s |
| #102 | Gemma 4 26B A4B none | 8.3 | 6.0 | 3/4 | 1.28s | |
| #105 | Nemotron 3 Super medium | NVIDIA | 8.3 | 5.8 | 3/4 | 7.85s |
| #119 | Cobuddy medium | Baidu | 8.7 | 5.6 | 3/4 | 10.00s |
| #32 | Gemini 3.5 Flash minimal | 6.5 | 7.7 | 2/4 | 892ms | |
| #34 | Qwen3.7 Max none | Qwen | 6.5 | 7.7 | 2/4 | 1.08s |
| #42 | GPT-5.2 medium | OpenAI | 6.5 | 7.5 | 2/4 | 7.81s |