反AIトリックモデルランキング

反AIトリックでどのAIモデルが最も強いか、どのモデルが安定しているか、差が大きいのはどこかを確認できます。並び替え: 指標 ↑.

表示モデル数

平均反AIトリックスコア

7.1

最良モデル

LFM2-24B-A2B 2.5

失敗理由

失敗理由不正解で293 失敗理由指示に従っていないで33 失敗理由余分な書式で20 失敗理由 API エラーで14 失敗理由タイムアウトで4 失敗理由回答なしで4

210/210

順位	モデル	企業	反AIトリックスコア	スコア	合計コスト	正解テスト	応答時間（平均）
#166	Qwen3 Coder Next none	Qwen	3.6	5.1	$0.025	0/4	3.31s
合計テスト数 4 誤答テスト数 4 合計コスト $0.025 応答時間（平均） 3.31s
#155	Kimi K2.5 none	Moonshot AI	3.6	5.5	$0.127	0/4	6.24s
合計テスト数 4 誤答テスト数 4 合計コスト $0.127 応答時間（平均） 6.24s
#161	Qwen3.6 35B A3B none	Qwen	3.6	5.3	$0.061	0/4	2.10s
合計テスト数 4 誤答テスト数 4 合計コスト $0.061 応答時間（平均） 2.10s
#157	Mimo V2 Omni none	Xiaomi	3.6	5.5	$0.021	0/4	1.63s
合計テスト数 4 誤答テスト数 4 合計コスト $0.021 応答時間（平均） 1.63s
#152	Qwen3.6 27B none	Qwen	3.8	5.5	$0.087	0/4	2.83s
合計テスト数 4 誤答テスト数 4 合計コスト $0.087 応答時間（平均） 2.83s
#151	GLM 5.1 none	Z.ai	4.0	5.5	$0.164	0/4	2.11s
合計テスト数 4 誤答テスト数 4 合計コスト $0.164 応答時間（平均） 2.11s
#191	Grok 4.20 Beta none	X AI	4.0	4.4	$0.087	0/4	597ms
合計テスト数 4 誤答テスト数 4 合計コスト $0.087 応答時間（平均） 597ms
#138	Kimi K2.6 none	Moonshot AI	4.6	5.8	$0.184	1/4	1.39s
合計テスト数 4 誤答テスト数 3 合計コスト $0.184 応答時間（平均） 1.39s
#194	GLM 4.7 Flash medium	Z.ai	4.7	4.3	$0.166	1/4	15.0s
合計テスト数 4 誤答テスト数 3 合計コスト $0.166 応答時間（平均） 15.0s
#63	Claude Sonnet 4.6 none	Anthropic	4.8	7.3	$0.661	1/4	2.94s
合計テスト数 4 誤答テスト数 3 合計コスト $0.661 応答時間（平均） 2.94s
#102	Laguna XS 2.1 medium	Poolside	4.8	6.5	$0.068	1/4	42.0s
合計テスト数 4 誤答テスト数 3 合計コスト $0.068 応答時間（平均） 42.0s
#103	Qwen3.5-27B none	Qwen	4.8	6.5	$0.090	1/4	788ms
合計テスト数 4 誤答テスト数 3 合計コスト $0.090 応答時間（平均） 788ms
#107	Qwen3.5 Plus 2026-02-15 none	Qwen	4.8	6.4	$0.073	1/4	1.91s
合計テスト数 4 誤答テスト数 3 合計コスト $0.073 応答時間（平均） 1.91s
#111	LongCat 2.0 none	Meituan	4.8	6.3	$0.044	1/4	2.87s
合計テスト数 4 誤答テスト数 3 合計コスト $0.044 応答時間（平均） 2.87s
#126	Qwen3.5 Plus 2026-04-20 none	Qwen	4.8	6.1	$0.122	1/4	1.88s
合計テスト数 4 誤答テスト数 3 合計コスト $0.122 応答時間（平均） 1.88s

反AIトリックランキング

モデルを絞り込む

反AIトリックスコア上位モデル

反AIトリックスコア vs 合計コスト

応答時間（平均）上位モデル

反AIトリック ランキング

モデルを絞り込む

反AIトリック スコア 上位モデル

反AIトリック スコア vs 合計コスト

応答時間（平均） 上位モデル

反AIトリックランキング

反AIトリックスコア上位モデル

反AIトリックスコア vs 合計コスト

応答時間（平均）上位モデル