Compare Charts Methodology

Language:

❤️ Made by XCS

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Xiaomi: MiMo-V2-Flash

Compare:

Last updated at: 2026-03-05

Metric	Google: Gemini 3.1 Flash Lite Preview none Release: 2026-03-03	Xiaomi: MiMo-V2-Flash medium Release: 2025-12-16
Avg Score	7.4	7.5
Rank	#20	#17
Tests Correct
Consistency	9.6	9.4
Cost per result	0.142	0.314
Total Cost	$0.015	$0.035
Attempt pass rate	71.1%	77.8%
Flaky tests	1	1
common.totalRuns	45 (15 x 3)	45 (15 x 3)
Output Tokens	4,646	11,526
Reasoning Tokens	0	106,226
Response Time (avg)	1.37s	27.68s
Response Time (max)	3.39s	96.01s
Response Time (total)	20.53s	249.14s

Top Models by Score

Score vs Total Cost

Response Time (avg)

Avg Score vs Response Time (avg)

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Google: Gemini 3.1 Flash Lite Preview	6.0	7.8	55.6%	1		1.16s	1,086	0
Xiaomi: MiMo-V2-Flash	9.7	10.0	100.0%	0		16.79s	1,328	18,739

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Google: Gemini 3.1 Flash Lite Preview	10.0	10.0	0.0%	0		3.20s	339	0
Xiaomi: MiMo-V2-Flash	9.0	10.0	100.0%	0		75.68s	442	26,859

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Google: Gemini 3.1 Flash Lite Preview	9.9	10.0	100.0%	0		1.22s	399	0
Xiaomi: MiMo-V2-Flash	5.5	10.0	50.0%	0		0ms	153	0

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Google: Gemini 3.1 Flash Lite Preview	4.0	10.0	33.3%	0		942ms	568	0
Xiaomi: MiMo-V2-Flash	4.0	7.2	55.6%	1		96.01s	8,374	42,461

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Google: Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.13s	574	0
Xiaomi: MiMo-V2-Flash	10.0	10.0	100.0%	0		4.28s	75	3,504

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Google: Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		972ms	898	0
Xiaomi: MiMo-V2-Flash	7.0	10.0	66.7%	0		3.77s	833	1,948

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Google: Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.39s	782	0
Xiaomi: MiMo-V2-Flash	10.0	10.0	100.0%	0		27.78s	321	12,715

Quick Compare

Switch Comparison Pair

GPT-5.3 ChatnonevsMiMo-V2-Flashmedium Gemini 3.1 Flash Lite PreviewnonevsGLM 5medium Gemini 3.1 Flash Lite PreviewnonevsStep 3.5 FlashmediumFree Available Gemini 3.1 Flash Lite PreviewlowvsMiMo-V2-Flashmedium Claude Sonnet 4.6mediumvsGemini 3.1 Flash Lite Previewnone DeepSeek V3.2mediumvsGemini 3.1 Flash Lite Previewnone GPT-5.2 ChatnonevsMiMo-V2-Flashmedium Seed-2.0-MinimediumvsGemini 3.1 Flash Lite Previewnone Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-Flashmedium Gemini 3 Flash PreviewnonevsMiMo-V2-Flashmedium Gemini 3.1 Flash Lite PreviewnonevsGPT-5.2medium Gemini 3.1 Flash Lite PreviewhighvsMiMo-V2-Flashmedium