反AI技巧模型排名

看看哪些 AI 模型在反AI技巧上表现最好，哪些更稳定，以及差距主要出现在哪里。排序方式: 响应时间（平均） ↑.

显示的模型数

反AI技巧得分平均值

7.1

最佳模型

Mistral Small 4 3.4

失败原因

失败原因为答案错误293 失败原因为未遵循指令33 失败原因为额外格式20 失败原因为 API 错误14 失败原因为无答案4 失败原因为超时4

210/210

排名	模型	公司	反AI技巧得分	分数	总成本	测试正确	响应时间（平均）
#132	GPT-5.6 Terra none	OpenAI	4.8	6.0	$0.349	1/4	942ms
总测试数 4 错误测试数 3 总成本 $0.349 响应时间（平均） 942ms
#193	Elephant Alpha none	Openrouter	6.6	4.3	$0.000	2/4	963ms
总测试数 4 错误测试数 2 总成本 $0.000 响应时间（平均） 963ms
#106	Gemini 3.1 Flash Lite Preview none	Google	7.5	6.4	$0.052	2/4	1.04s
总测试数 4 错误测试数 2 总成本 $0.052 响应时间（平均） 1.04s
#122	Gemini 3.1 Flash Lite none	Google	7.5	6.1	$0.046	2/4	1.07s
总测试数 4 错误测试数 2 总成本 $0.046 响应时间（平均） 1.07s
#203	Grok 4.1 Fast none	X AI	3.2	3.8	$0.008	0/4	1.07s
总测试数 4 错误测试数 4 总成本 $0.008 响应时间（平均） 1.07s
#59	Qwen3.7 Max none	Qwen	6.5	7.4	$0.197	2/4	1.08s
总测试数 4 错误测试数 2 总成本 $0.197 响应时间（平均） 1.08s
#120	Gemini 3.1 Flash Lite minimal	Google	8.3	6.1	$0.047	3/4	1.10s
总测试数 4 错误测试数 1 总成本 $0.047 响应时间（平均） 1.10s
#78	Mercury 2 medium	Inception	6.9	7.0	$0.093	2/4	1.12s
总测试数 4 错误测试数 2 总成本 $0.093 响应时间（平均） 1.12s
#180	GPT-5.4 Nano none	OpenAI	3.5	4.8	$0.041	0/4	1.18s
总测试数 4 错误测试数 4 总成本 $0.041 响应时间（平均） 1.18s
#195	Elephant Alpha medium	Openrouter	6.6	4.3	$0.000	2/4	1.19s
总测试数 4 错误测试数 2 总成本 $0.000 响应时间（平均） 1.19s
#200	MiMo-V2-Flash none	Xiaomi	3.2	4.0	$0.025	0/4	1.19s
总测试数 4 错误测试数 4 总成本 $0.025 响应时间（平均） 1.19s
#207	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	6.4	3.4	$0.000	2/4	1.20s
总测试数 4 错误测试数 2 总成本 $0.000 响应时间（平均） 1.20s
#139	GPT-5.4 none	OpenAI	3.2	5.8	$0.397	0/4	1.21s
总测试数 4 错误测试数 4 总成本 $0.397 响应时间（平均） 1.21s
#89	Gemini 3 Flash Preview none	Google	8.3	6.8	$0.085	3/4	1.25s
总测试数 4 错误测试数 1 总成本 $0.085 响应时间（平均） 1.25s
#83	GPT-5.6 Sol none	OpenAI	8.3	6.9	$0.524	3/4	1.27s
总测试数 4 错误测试数 1 总成本 $0.524 响应时间（平均） 1.27s

反AI技巧排名

筛选模型

按反AI技巧得分排名的顶级模型

反AI技巧得分 vs 总成本

按响应时间（平均）排名的顶级模型

反AI技巧 排名

筛选模型

按 反AI技巧 得分 排名的顶级模型

反AI技巧 得分 vs 总成本

按 响应时间（平均） 排名的顶级模型

反AI技巧排名

按反AI技巧得分排名的顶级模型

反AI技巧得分 vs 总成本

按响应时间（平均）排名的顶级模型