反AIトリックモデルランキング

反AIトリックでどのAIモデルが最も強いか、どのモデルが安定しているか、差が大きいのはどこかを確認できます。

表示モデル数

平均反AIトリックスコア

7.1

最良モデル

Gemini 3 Flash Preview 10.0

失敗理由

失敗理由不正解で293 失敗理由指示に従っていないで33 失敗理由余分な書式で20 失敗理由 API エラーで14 失敗理由タイムアウトで4 失敗理由回答なしで4

210/210

順位	モデル	企業	反AIトリックスコア	スコア	合計コスト	正解テスト	応答時間（平均）
#22	Grok 4.5 medium	X AI	10.0	8.3	$1.928	4/4	23.5s
合計テスト数 4 誤答テスト数 0 合計コスト $1.928 応答時間（平均） 23.5s
#23	Claude Sonnet 5 medium	Anthropic	10.0	8.3	$0.922	4/4	3.80s
合計テスト数 4 誤答テスト数 0 合計コスト $0.922 応答時間（平均） 3.80s
#28	Inkling high	Thinkingmachines	10.0	8.0	$1.006	4/4	12.7s
合計テスト数 4 誤答テスト数 0 合計コスト $1.006 応答時間（平均） 12.7s
#31	GLM 5.2 high	Z.ai	10.0	8.0	$0.970	4/4	5.80s
合計テスト数 4 誤答テスト数 0 合計コスト $0.970 応答時間（平均） 5.80s
#33	Kimi K3 max	Moonshot AI	10.0	8.0	$3.112	4/4	10.2s
合計テスト数 4 誤答テスト数 0 合計コスト $3.112 応答時間（平均） 10.2s
#36	Qwen3.7 Plus medium	Qwen	10.0	7.9	$0.267	4/4	8.58s
合計テスト数 4 誤答テスト数 0 合計コスト $0.267 応答時間（平均） 8.58s
#37	Qwen3.6 Plus medium	Qwen	10.0	7.8	$0.405	4/4	9.90s
合計テスト数 4 誤答テスト数 0 合計コスト $0.405 応答時間（平均） 9.90s
#38	GLM 5.2 medium	Z.ai	10.0	7.8	$0.222	4/4	5.89s
合計テスト数 4 誤答テスト数 0 合計コスト $0.222 応答時間（平均） 5.89s
#41	Claude Opus 4.8 low	Anthropic	10.0	7.8	$2.077	4/4	3.30s
合計テスト数 4 誤答テスト数 0 合計コスト $2.077 応答時間（平均） 3.30s
#42	GLM 5 medium	Z.ai	10.0	7.7	$0.307	4/4	23.7s
合計テスト数 4 誤答テスト数 0 合計コスト $0.307 応答時間（平均） 23.7s
#49	GLM 5 Turbo medium	Z.ai	10.0	7.6	$0.323	4/4	4.82s
合計テスト数 4 誤答テスト数 0 合計コスト $0.323 応答時間（平均） 4.82s
#51	Nemotron 3 Ultra medium	NVIDIA	10.0	7.5	$0.774	4/4	8.62s
合計テスト数 4 誤答テスト数 0 合計コスト $0.774 応答時間（平均） 8.62s
#60	LongCat 2.0 medium	Meituan	10.0	7.4	$0.478	4/4	9.65s
合計テスト数 4 誤答テスト数 0 合計コスト $0.478 応答時間（平均） 9.65s
#61	Gemini 3 Flash Preview low	Google	10.0	7.4	$0.177	4/4	3.48s
合計テスト数 4 誤答テスト数 0 合計コスト $0.177 応答時間（平均） 3.48s
#70	Qwen3.5 Plus 2026-04-20 medium	Qwen	10.0	7.2	$0.317	4/4	10.8s
合計テスト数 4 誤答テスト数 0 合計コスト $0.317 応答時間（平均） 10.8s

反AIトリックランキング

モデルを絞り込む

反AIトリックスコア上位モデル

反AIトリックスコア vs 合計コスト

応答時間（平均）上位モデル

反AIトリック ランキング

モデルを絞り込む

反AIトリック スコア 上位モデル

反AIトリック スコア vs 合計コスト

応答時間（平均） 上位モデル

反AIトリックランキング

反AIトリックスコア上位モデル

反AIトリックスコア vs 合計コスト

応答時間（平均）上位モデル