比较图表

语言:

❤️ Made by XCS

#10

Gemini 3.1 Flash Lite Preview

Google · 发布日期: 2026-03-03 · google/gemini-3.1-flash-lite-preview::none

平均分

7.70

每个结果成本

0.116

一致性

9.54

总成本

$0.011

测试正确

9

只有当某个测试的所有运行都通过时，才计为完全通过。

错误测试数

5

尝试通过率: 69.1%

不稳定测试

1

响应时间：平均 1.24s · 总计 17.33s · 最大 3.39s

答案错误: 3 未遵循指令: 2

按分数排名的模型

先选择第一个模型，再点击第二个模型打开并排页面。

#4 Qwen3.5 Plus 2026-02-15 8.65

#5 Qwen3.5-27B 8.56

#6 Gemini 3 Flash Preview 8.36

#7 GPT-5.3-Codex 7.93

#8 Gemini 3.1 Flash Lite Preview 7.84

#9 Gemini 3.1 Flash Lite Preview 7.77

#10 Gemini 3.1 Flash Lite Preview 7.70

#11 Claude Sonnet 4.6 7.43

#12 GPT-5.2 Chat 7.42

#13 GLM 5 7.29

#14 GPT-5.3 Chat 7.27

#15 Gemini 3 Flash Preview 7.22

#16 Gemini 2.5 Flash 7.06

快速对比

Gemini 3.1 Flash Lite PreviewnonevsGemini 3.1 Flash Lite Previewhigh Gemini 3.1 Flash Lite PreviewnonevsClaude Sonnet 4.6medium Gemini 3.1 Flash Lite PreviewnonevsGemini 3.1 Flash Lite Previewlow Gemini 3.1 Flash Lite PreviewnonevsGPT-5.2 Chatnone Gemini 3.1 Flash Lite PreviewnonevsGPT-5.3-Codexmedium Gemini 3.1 Flash Lite PreviewnonevsGLM 5medium Gemini 3.1 Flash Lite PreviewnonevsGemini 3 Flash Previewmedium Gemini 3.1 Flash Lite PreviewnonevsGemini 3.1 Pro Previewmedium Gemini 3.1 Flash Lite PreviewnonevsStep 3.5 Flashmedium免费可用

类别细分

类别	平均分	一致性	测试正确
Anti-AI Tricks	6.00	7.85	1/3
Data parsing and extraction	9.88	10.00	2/2
Domain specific	4.00	10.00	1/3
Instructions following	9.00	10.00	1/2
Puzzle Solving	10.00	10.00	3/3
Tool Calling	10.00	10.00	1/1