反AIトリックモデルランキング

反AIトリックでどのAIモデルが最も強いか、どのモデルが安定しているか、差が大きいのはどこかを確認できます。並び替え: 応答時間（平均） ↑.

表示モデル数

平均反AIトリックスコア

7.1

最良モデル

Mistral Small 4 3.4

失敗理由

失敗理由不正解で293 失敗理由指示に従っていないで33 失敗理由余分な書式で20 失敗理由 API エラーで14 失敗理由タイムアウトで4 失敗理由回答なしで4

210/210

順位	モデル	企業	反AIトリックスコア	スコア	合計コスト	正解テスト	応答時間（平均）
#132	GPT-5.6 Terra none	OpenAI	4.8	6.0	$0.349	1/4	942ms
合計テスト数 4 誤答テスト数 3 合計コスト $0.349 応答時間（平均） 942ms
#193	Elephant Alpha none	Openrouter	6.6	4.3	$0.000	2/4	963ms
合計テスト数 4 誤答テスト数 2 合計コスト $0.000 応答時間（平均） 963ms
#106	Gemini 3.1 Flash Lite Preview none	Google	7.5	6.4	$0.052	2/4	1.04s
合計テスト数 4 誤答テスト数 2 合計コスト $0.052 応答時間（平均） 1.04s
#122	Gemini 3.1 Flash Lite none	Google	7.5	6.1	$0.046	2/4	1.07s
合計テスト数 4 誤答テスト数 2 合計コスト $0.046 応答時間（平均） 1.07s
#203	Grok 4.1 Fast none	X AI	3.2	3.8	$0.008	0/4	1.07s
合計テスト数 4 誤答テスト数 4 合計コスト $0.008 応答時間（平均） 1.07s
#59	Qwen3.7 Max none	Qwen	6.5	7.4	$0.197	2/4	1.08s
合計テスト数 4 誤答テスト数 2 合計コスト $0.197 応答時間（平均） 1.08s
#120	Gemini 3.1 Flash Lite minimal	Google	8.3	6.1	$0.047	3/4	1.10s
合計テスト数 4 誤答テスト数 1 合計コスト $0.047 応答時間（平均） 1.10s
#78	Mercury 2 medium	Inception	6.9	7.0	$0.093	2/4	1.12s
合計テスト数 4 誤答テスト数 2 合計コスト $0.093 応答時間（平均） 1.12s
#180	GPT-5.4 Nano none	OpenAI	3.5	4.8	$0.041	0/4	1.18s
合計テスト数 4 誤答テスト数 4 合計コスト $0.041 応答時間（平均） 1.18s
#195	Elephant Alpha medium	Openrouter	6.6	4.3	$0.000	2/4	1.19s
合計テスト数 4 誤答テスト数 2 合計コスト $0.000 応答時間（平均） 1.19s
#200	MiMo-V2-Flash none	Xiaomi	3.2	4.0	$0.025	0/4	1.19s
合計テスト数 4 誤答テスト数 4 合計コスト $0.025 応答時間（平均） 1.19s
#207	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	6.4	3.4	$0.000	2/4	1.20s
合計テスト数 4 誤答テスト数 2 合計コスト $0.000 応答時間（平均） 1.20s
#139	GPT-5.4 none	OpenAI	3.2	5.8	$0.397	0/4	1.21s
合計テスト数 4 誤答テスト数 4 合計コスト $0.397 応答時間（平均） 1.21s
#89	Gemini 3 Flash Preview none	Google	8.3	6.8	$0.085	3/4	1.25s
合計テスト数 4 誤答テスト数 1 合計コスト $0.085 応答時間（平均） 1.25s
#83	GPT-5.6 Sol none	OpenAI	8.3	6.9	$0.524	3/4	1.27s
合計テスト数 4 誤答テスト数 1 合計コスト $0.524 応答時間（平均） 1.27s

反AIトリックランキング

モデルを絞り込む

反AIトリックスコア上位モデル

反AIトリックスコア vs 合計コスト

応答時間（平均）上位モデル

反AIトリック ランキング

モデルを絞り込む

反AIトリック スコア 上位モデル

反AIトリック スコア vs 合計コスト

応答時間（平均） 上位モデル

反AIトリックランキング

反AIトリックスコア上位モデル

反AIトリックスコア vs 合計コスト

応答時間（平均）上位モデル