反AIトリックモデルランキング

反AIトリックでどのAIモデルが最も強いか、どのモデルが安定しているか、差が大きいのはどこかを確認できます。並び替え: 正解テスト ↑.

表示モデル数

平均反AIトリックスコア

7.2

最良モデル

DeepSeek V4 Pro 3.2

失敗理由

失敗理由不正解で293 失敗理由指示に従っていないで33 失敗理由余分な書式で20 失敗理由 API エラーで14 失敗理由タイムアウトで4 失敗理由回答なしで4

216/216

順位	モデル	企業	反AIトリックスコア	スコア	合計コスト	正解テスト	応答時間（平均）
#197	Grok 4.20 Beta none	X AI	4.0	4.4	$0.087	0/4	597ms
合計テスト数 4 誤答テスト数 4 合計コスト $0.087 応答時間（平均） 597ms
#198	Laguna M.1 none	Poolside	3.4	4.4	$0.009	0/4	705ms
合計テスト数 4 誤答テスト数 4 合計コスト $0.009 応答時間（平均） 705ms
#202	Hunter Alpha none	OpenRouter	3.5	4.2	$0.000	0/4	3.81s
合計テスト数 4 誤答テスト数 4 合計コスト $0.000 応答時間（平均） 3.81s
#206	MiMo-V2-Flash none	Xiaomi	3.2	4.0	$0.025	0/4	1.19s
合計テスト数 4 誤答テスト数 4 合計コスト $0.025 応答時間（平均） 1.19s
#209	Grok 4.1 Fast none	X AI	3.2	3.8	$0.008	0/4	1.07s
合計テスト数 4 誤答テスト数 4 合計コスト $0.008 応答時間（平均） 1.07s
#211	Laguna Xs.2 none	Poolside	3.0	3.8	$0.004	0/4	534ms
合計テスト数 4 誤答テスト数 4 合計コスト $0.004 応答時間（平均） 534ms
#216	LFM2-24B-A2B none	Liquid	2.5	2.2	$0.001	0/3	471ms
合計テスト数 3 誤答テスト数 3 合計コスト $0.001 応答時間（平均） 471ms
#50	DeepSeek V4 Pro high	DeepSeek	5.7	7.7	$0.200	1/4	25.7s
合計テスト数 4 誤答テスト数 3 合計コスト $0.200 応答時間（平均） 25.7s
#51	MiniMax M3 medium	Minimax	5.5	7.6	$0.286	1/4	14.9s
合計テスト数 4 誤答テスト数 3 合計コスト $0.286 応答時間（平均） 14.9s
#67	Claude Sonnet 4.6 none	Anthropic	4.8	7.3	$0.661	1/4	2.94s
合計テスト数 4 誤答テスト数 3 合計コスト $0.661 応答時間（平均） 2.94s
#103	Qwen3.6 Max Preview none	Qwen	5.2	6.6	$0.231	1/4	2.63s
合計テスト数 4 誤答テスト数 3 合計コスト $0.231 応答時間（平均） 2.63s
#108	Laguna XS 2.1 medium	Poolside	4.8	6.5	$0.068	1/4	42.0s
合計テスト数 4 誤答テスト数 3 合計コスト $0.068 応答時間（平均） 42.0s
#109	Qwen3.5-27B none	Qwen	4.8	6.5	$0.090	1/4	788ms
合計テスト数 4 誤答テスト数 3 合計コスト $0.090 応答時間（平均） 788ms
#113	Qwen3.5 Plus 2026-02-15 none	Qwen	4.8	6.4	$0.073	1/4	1.91s
合計テスト数 4 誤答テスト数 3 合計コスト $0.073 応答時間（平均） 1.91s
#117	LongCat 2.0 none	Meituan	4.8	6.3	$0.044	1/4	2.87s
合計テスト数 4 誤答テスト数 3 合計コスト $0.044 応答時間（平均） 2.87s

反AIトリックランキング

モデルを絞り込む

反AIトリックスコア上位モデル

反AIトリックスコア vs 合計コスト

応答時間（平均）上位モデル

反AIトリック ランキング

モデルを絞り込む

反AIトリック スコア 上位モデル

反AIトリック スコア vs 合計コスト

応答時間（平均） 上位モデル

反AIトリックランキング

反AIトリックスコア上位モデル

反AIトリックスコア vs 合計コスト

応答時間（平均）上位モデル