反AIトリックモデルランキング

反AIトリックでどのAIモデルが最も強いか、どのモデルが安定しているか、差が大きいのはどこかを確認できます。並び替え: 応答時間（平均） ↓.

表示モデル数

平均反AIトリックスコア

7.2

最良モデル

Seed-2.0-Mini 6.6

失敗理由

失敗理由不正解で293 失敗理由指示に従っていないで33 失敗理由余分な書式で20 失敗理由 API エラーで14 失敗理由タイムアウトで4 失敗理由回答なしで4

216/216

順位	モデル	企業	反AIトリックスコア	スコア	合計コスト	正解テスト	応答時間（平均）
#78	GLM 5.1 medium	Z.ai	10.0	7.1	$0.535	4/4	8.31s
合計テスト数 4 誤答テスト数 0 合計コスト $0.535 応答時間（平均） 8.31s
#10	Gemini 3.1 Pro Preview medium	Google	10.0	9.2	$1.361	4/4	7.90s
合計テスト数 4 誤答テスト数 0 合計コスト $1.361 応答時間（平均） 7.90s
#146	Nemotron 3 Super medium	NVIDIA	8.3	5.7	$0.055	3/4	7.85s
合計テスト数 4 誤答テスト数 1 合計コスト $0.055 応答時間（平均） 7.85s
#24	GPT-5.2 medium	OpenAI	6.5	8.4	$0.951	2/4	7.81s
合計テスト数 4 誤答テスト数 2 合計コスト $0.951 応答時間（平均） 7.81s
#102	LongCat 2.0 high	Meituan	8.9	6.6	$0.469	3/4	7.76s
合計テスト数 4 誤答テスト数 1 合計コスト $0.469 応答時間（平均） 7.76s
#47	Claude Opus 4.6 medium	Anthropic	6.4	7.7	$3.059	2/4	7.45s
合計テスト数 4 誤答テスト数 2 合計コスト $3.059 応答時間（平均） 7.45s
#52	Grok Build 0.1 medium	X AI	8.3	7.6	$1.097	3/4	7.43s
合計テスト数 4 誤答テスト数 1 合計コスト $1.097 応答時間（平均） 7.43s
#106	Hy3 preview medium	Tencent	10.0	6.5	$0.018	4/4	6.59s
合計テスト数 4 誤答テスト数 0 合計コスト $0.018 応答時間（平均） 6.59s
#168	Ling-2.6-1T none	Inclusionai	3.4	5.3	$0.016	0/4	6.55s
合計テスト数 4 誤答テスト数 4 合計コスト $0.016 応答時間（平均） 6.55s
#36	Inkling medium	Thinkingmachines	8.7	8.0	$0.391	3/4	6.49s
合計テスト数 4 誤答テスト数 1 合計コスト $0.391 応答時間（平均） 6.49s
#11	Qwen3.7 Max medium	Qwen	10.0	9.2	$1.116	4/4	6.36s
合計テスト数 4 誤答テスト数 0 合計コスト $1.116 応答時間（平均） 6.36s
#28	Gemini 2.5 Flash medium	Google	8.4	8.2	$0.643	3/4	6.30s
合計テスト数 4 誤答テスト数 1 合計コスト $0.643 応答時間（平均） 6.30s
#208	Grok Build 0.1 none	X AI	8.7	4.0	$0.547	3/4	6.30s
合計テスト数 4 誤答テスト数 1 合計コスト $0.547 応答時間（平均） 6.30s
#161	Kimi K2.5 none	Moonshot AI	3.6	5.5	$0.127	0/4	6.24s
合計テスト数 4 誤答テスト数 4 合計コスト $0.127 応答時間（平均） 6.24s
#20	Claude Fable 5 medium	Anthropic	10.0	8.6	$3.478	4/4	6.20s
合計テスト数 4 誤答テスト数 0 合計コスト $3.478 応答時間（平均） 6.20s

反AIトリックランキング

モデルを絞り込む

反AIトリックスコア上位モデル

反AIトリックスコア vs 合計コスト

応答時間（平均）上位モデル

反AIトリック ランキング

モデルを絞り込む

反AIトリック スコア 上位モデル

反AIトリック スコア vs 合計コスト

応答時間（平均） 上位モデル

反AIトリックランキング

反AIトリックスコア上位モデル

反AIトリックスコア vs 合計コスト

応答時間（平均）上位モデル